Village de la Justice www.village-justice.com

DataJust, ou l’avènement de l’indemnisation prédictive.
Parution : mercredi 1er avril 2020
Adresse de l'article original :
https://www.village-justice.com/articles/datajust-avenement-indemnisation-predictive,34503.html
Reproduction interdite sans autorisation de l'auteur.

A l’ère du numérique et du « Big Data », où la rationalisation devient la norme, il ne manque qu’une légère poussée pour achever d’ouvrir une porte déjà entre-ouverte sur la justice prédictive.
Cette poussée pourrait bien avoir été exercée en cette période de crise dû au Coronavirus.
En effet, est paru au Journal officiel du 29 Mars 2020, un décret n°2020-356 du 27 mars 2020 portant création d’un traitement automatisé de données à caractère personnel dénommé « DataJust » [1].
Ce décret autorise le garde des sceaux, ministre de la Justice à mettre en œuvre un traitement automatisé de données à caractère personnel, « DataJust », dans l’optique de créer un outil de modélisation de l’évaluation du préjudice corporel.

I. Contexte et genèse.

Tout d’abord, il est à rappeler que, l’existence du « Big Data » dans le monde juridique n’est pas nouvelle et cela est particulièrement vrai depuis la loi N°2016-1321 du 7 Octobre 2016 [2] pour une République numérique créant l’« open-data » en prévoyant notamment au terme de son article 21 que « sans préjudice des dispositions particulières qui régissent l’accès aux décisions de justice et leur publicité, les décisions rendues par les juridictions judiciaires sont mises à la disposition du public à titre gratuit dans le respect de la vie privée des personnes concernées. ».

Par données massives ou « Big Data », il faut comprendre un ensemble de données dont le volume est si important que son analyse par le biais d’outils classiques de gestion de base de données est extrêmement difficile, si ce n’est impossible.

L’analyse de ces données jurisprudentielles, via des outils d’intelligence artificielle permettrait par exemple, de déterminer la solution probable d’un litige au regard des termes employés par les juges et les parties.

Il convient alors ici de parler de « justice prédictive » ou dans son acception moins mystique, de « justice prévisible » (Voir en ce sens l’allocution de Monsieur Jean-Claude Marin, procureur général près de la Cour de cassation, lors du colloque « La justice prédictive » organisé par l’Ordre des avocats au Conseil d’état et à la Cour de cassation, le lundi 12 février 2018 [3]).

Soucieux d’investir ce domaine, le Ministère de la Justice, à travers sa Direction des affaires civiles et du sceau a souhaité créer son propre outil d’analyse des données jurisprudentielles administratives et judiciaires relatives à l’indemnisation du préjudice corporel dans l’optique de mettre à la disposition des magistrats, des assureurs, des fonds d’indemnisation, des avocats et des victimes, un référentiel indicatif officiel, permettant de mieux évaluer financièrement les préjudices.

C’est ainsi que dans le cadre de la deuxième édition de la Vendôme Tech, pour la modernisation numérique de la justice [4], le ministère de la Justice a fait appel à des data scientists, entrepreneurs d’intérêts général pour le développement d’un outil d’analyse devant permettre de garantir un traitement égalitaire et juste des demandes d’indemnisation de préjudices corporels [5], ce projet s’inscrivant dans le cadre de l’avant-projet de réforme de la responsabilité civile [6].

II. Fonctionnement en détail.

Pour appréhender le fonctionnement de DataJust il faut comprendre que l’objectif poursuivis par ses développeurs était la création d’un outil d’analyse de la jurisprudence destiné à constituer un référentiel fiable de l’indemnisation des préjudices corporels.

Trois étapes sont donc à détailler.

Étape 1 : Extraction de données.

Tout d’abord, l’outil fonctionne à partir de données extraites de la jurisprudence.

Spécifiquement, ces données proviennent des décisions de justices rendues en appel relatives à l’indemnisation du préjudice corporel, du 1er Janvier 2017 au 31 décembre 2019 par les juridictions judiciaires (base de données JURICA pour la Cour de cassation) et administratives (base de données ARIANE pour le conseil d’état).

Étape 2 : Recensement algorithmique des données extraites.

Ensuite, l’algorithme extrait et enregistre les différentes informations pertinentes dans les décisions de justice.

Le recensement algorithmique des données extraites des décisions se fait sur 41 critères [7] que sont notamment l’âge, le genre, la profession de la victime, le type de dommage, les critères de gravité du dommage, le montant alloué par postes de préjudice listés dans la nomenclature Dintilhac [8] etc…

Étape 3 : Élaboration d’un référentiel indicatif d’indemnisation.

Enfin, le recueil de données devra permettre, à terme, l’élaboration d’un référentiel indicatif d’indemnisation qui sera diffusé au public et aux professionnels.

Pour cela, 4 outils et ressources produits sont mis en place, il s’agit d’un protocole d’annotation, d’une plateforme d’annotation, d’un algorithme de pré-annotation ainsi qu’une interface de visualisation.

Ces outils d’annotation, devant faire l’objet d’un contrôle humain, contribueront à la création d’un référentiel d’indemnisation indicatif qui sera transmis au public via une interface de restitution des montants de réparation alloués.

Ainsi, les victimes seront informées sur les montants d’indemnisation auxquels elles pourront prétendre.

Pour synthétiser, DataJust est un dispositif algorithmique recensant les montants, par poste de préjudice, alloués aux victimes en indemnisation à l’occasion d’un litige ayant pour finalité l’élaboration d’un référentiel indicatif d’indemnisation officiel.

III. L’avis de la CNIL sur ce traitement automatisé de données à caractère personnelle.

La Commission nationale de l’informatique et des libertés (CNIL) a été saisie le 7 Novembre 2019 par le ministre de la justice d’une demande d’avis concernant un projet de décret portant création d’un traitement automatisé de données à caractère personnel dénommé « DataJust ». (Demande d’avis n°19020148).

Au terme de sa délibération n°2020-002 du 9 janvier 2020 [9] , la CNIL estime (outre de légères réserves ponctuelles.) que le recueil des données n’appelle pas d’observation particulière dès lors que les finalités du traitement « DataJust » doivent permettre une meilleure administration de la justice et la mise à disposition des justiciables d’un outil leur permettant d’effectuer un choix de manière plus éclairée quant à la pertinence ou non d’engager un contentieux ou d’accepter ou non les offres d’indemnisation proposées par les assureurs.

La commission préconise tout de même de porter une attention particulière aux évolutions envisagées de l’algorithme et particulièrement à la présence de biais éventuels.
Ces biais pourraient provenir de pratiques discriminatoires liées par exemple à l’origine ethnique, au genre ou encore à la situation géographique.

IV. Le décret du 27 Mars 2020.

L’article 1er du Décret n° 2020-356 du 27 mars 2020 [10], portant création d’un traitement automatisé de données à caractère personnel dénommé « DataJust » fixe le cadre du développement de l’algorithme en prévoyant sa mise en œuvre pour une durée de deux ans et en prévoyant que ce dernier devra permettre :
- De réaliser l’évaluation rétrospective et prospective des politiques publiques en matière de responsabilité civile ou administrative,
- D’élaborer un référentiel indicatif d’indemnisation des préjudices corporels,
- D’informer les parties et d’aider à l’évaluation du montant de l’indemnisation à laquelle les victimes peuvent prétendre afin de favoriser un règlement amiable des litiges,
- D’informer ou de documenter les juges appelés à statuer sur des demandes d’indemnisation des préjudices corporels.

L’article 2 du décret détaille quant à lui les données faisant l’objet d’enregistrement dans le traitement algorithmique.
Ces dernières sont constituées par :
- Les informations d’identification des personnes physiques (Genre, date de naissance, lieu de résidence etc…).
- Les informations relatives aux préjudices subis (Nature et ampleur des atteintes, description et localisation des lésions, durées d’hospitalisation, différents types de dépenses de santé et d’aménagement, ampleur des besoins de la victime en assistance par tierce personne, préjudices scolaires, état antérieur de la victime, ses prédispositions pathologiques et autres antécédents médicaux etc…).
- Les données relatives à la vie professionnelle et à la situation financière, (Perspectives d’évolution, droits à la retraite, montant des gains et pertes de gains professionnels des victimes etc…),
- Les avis des médecins et experts ayant examiné la victime et le montant de leurs honoraires,
- Les données relatives à des infractions et condamnations pénales,
- Les données relatives à des fautes civiles,
- Le numéro des décisions de justice.

S’agissant de l’accès à ces données, l’article 3 de ce même décret le réserve eux seules personnes qui, à raison de leurs attributions, ont besoin d’en connaître (Agents du ministère de la justice individuellement désignés par le secrétaire général et agents du bureau du droit des obligations individuellement désignés par le directeur des affaires civiles et du sceau.).

L’article 4 fixe la durée de conservation de ces données à deux ans maximums et l’article 6 détail les modalités d’exercice des droits d’accès, de rectification et de limitation prévu par le règlement (UE) 2016/679 du 27 avril 2016.

V. DataJust, ce qu’il faut en penser.

L’objectif ici est explicite, il s’agit d’ouvrir la porte à l’intelligence artificielle afin d’analyser les impacts des politiques publiques en matière de responsabilité (Notamment celles concernant la réforme à venir en responsabilité civile.) et de favoriser les règlements transactionnels pour offrir une respiration à nos tribunaux.

A la défense de la justice augmentée, les arguments de transparence et de sécurité juridique, mais ces arguments ne tiennent que si les algorithmes sur lesquels elle se fonde ont démontré leur fiabilité et leur éthique inébranlables.

Pour l’heure, les avocats sont en droit d’appréhender avec méfiance ces algorithmes dont la transparence et la neutralité des mécanismes d’instructions doivent encore être garantis.

Bien qu’il ne faille pas non plus y voir l’avènement du « juge-robot », DataJust plaide encore pour la mutation profonde de la justice et de ce fait pour celle de la profession d’avocat.

Mais l’avocat numérique devra rester humain et charge à lui d’utiliser la période d’observation de deux ans pour s’emparer de cet outil en questionnant la fiabilité du barème d’indemnisation, en défendant les droits liés à l’individualité de la victime ainsi que la particularité de son préjudice et en la protégeant d’un éventuel biais.

Ainsi, bien que l’émergence de DataJust génère de nombreuses incertitudes, il est encore bien tôt pour ancrer son positionnement. La seule certitude tiendra dans le fait que l’avocat devra rester le fil nécessaire à ce que le numérique ne soit pas trop déconnecté.

Kevin GENTILI Elève-avocat (en formation initiale au sein de l'EDASE.) Droit de la responsabilité. Droit du dommage corporel.