Intelligence artificielle et données de santé : l’ambition française
Par Elisabeth Logeais
Le 21 mars dernier, l’Office parlementaire d’évaluation des choix scientifiques et technologiques (OPECST) publiait le compte-rendu d’une audition publique[1] sur le sujet de l’intelligence artificielle et des données de santé, dans le cadre du projet de loi sur l’organisation et la transformation du système de santé.
Le 26 mars 2019, l’Assemblée Nationale adoptait en première lecture le projet de loi réformant le système de santé dont le Sénat est en train de débattre ce mois de Juin [2]. Le titre III du projet de loi est consacré au « développement de l’ambition numérique en santé », un défi à relever rapidement.
Le 6 juin 2019, le Sénat a adopté les articles 11 et 12 du Titre III sur le volet numérique du projet de loi.
I L’enjeu de la protection et de la valorisation des données de santé
Le débat à l’OPECST fut centré sur les 2 piliers du volet santé 4.0 du projet de loi, à savoir la création (i) d’une Plateforme de Données de Santé (PDS) ou « Health Data Hub » remplaçant l’INDS[3] et (ii) d’un Espace Numérique de Santé (ENS) du patient succédant au DMP (Dossier Médical Partagé), tels qu’envisagés aux articles 11 et 12 du projet de loi.
Ce débat a montré
- que la nécessité de cette plateforme « Health Data Hub » était largement acceptée
C’est un constat d’évidence :
- Les professionnels de santé utilisent de plus en plus des outils d’aide à l’analyse basée sur l’intelligence artificielle qui ne peut se développer que sur des volumes très importants de données de santé de patients ;
- les données medico-administratives du SNIIRAM sont un gisement exceptionnel permettant de développer des algorithmes adaptés à la population française ;
- la qualité et le coût des soins peuvent profiter de la collecte la plus large possible des données de santé si le patient a confiance dans les garanties données par la future plateforme sur l’accès et l’usage de ces données.
- qu’il y a plusieurs actions à mener jusqu’à une mise en place opérationnelle
- assurer l’interopérabilité des systèmes d’information (structurer les données du SNIIRAM pour les rendre opérationnelles et interfaçables avec d’autres sources et généraliser l’utilisation du numéro SS comme seul identifiant national de santé – INS [4]) ;
- recruter des professionnels au profil technologique pointu (data scientists, informaticiens , développeurs IA, …)
- donner un statut juridique adapté à cette plateforme ; la forme du GIP (Groupement d’intérêt public) destinée à garantir un contrôle public protecteur des données de santé n’a pas retenu les suffrages des participants à l’audition qui ont mis en avant la forme d’une société anonyme simplifiée (avec un actionnariat public), répondant mieuxaux nécessités d’évolution de la gouvernance, de facilité de partenariats et d’attractivité à l’international.
- Concevoir un système suffisamment puissant en termes de capacité de stockage et de puissance de calcul pour développer des algorithmes dont la fiabilité devra pouvoir être vérifiée et l’usage encadré puisqu’ils seront de plus en plus prédictifs et prescripteurs de soins.
II Le paysage actuel commenté lors de l’audition
- Le progrès des connaissances et des techniques avec l’IA
- Les outils d’aide au diagnostic et à la définition du traitement font des progrès rapides, notamment dans le domaine de l’imagerie et de la simulation. Des logiciels d’apprentissage entrainés sur les milliers d’images ont ainsi été développés en dermatologie, radiologie et ophtalmologie permettant de qualifier une image (suspecte ou normale) dans un contexte de diagnostic [5]. Par ailleurs, la robotique chirurgicale est aujourd’hui incontournable et la communication digitale facilite l’avènement de la télémédecine et du télédiagnostic.
- La recherche médicale doit dépasser les essais cliniques actuels qui portent sur des pathologies précises et qui sont souvent longs et coûteux. Le développement des bases ou entrepôts de données[6] et de plateformes plus généralistes permettront de faciliter la recherche fondamentale en santé en plus de la recherche opérationnelle.
- la performance de ces nouveaux outils d’IA et la confiance des professionnels et des patients dans leur pertinence dépend du volume et de la qualité des données sur lesquelles l’algorithme est entrainé. L’objectif primordial du Health Data Hub est d’accélérer la réalisation de ces projets de rassemblement de données de santé en enrichissant les données médico-administratives du SNIIRAM avec des analyses médicales et des diagnostics médicaux[7].
- La construction d’une filière des données de santé
- Elle est nécessaire car les sources des données de santé sont multiples, disparates, dans des bases publiques et privées et géographiquement éclatées.
- Cette filière doit être structurée autour de nouveaux métiers et outils en matière de circulation sécurisée des données, d’authentification, d’accessibilité et d’hébergement. Le recours aux référentiels de sécurité et d’interopérabilité permet d’avancer mais il implique de vérifier leur efficacité et leur opposabilité.
- La sécurité du stockage et de l’hébergement des données est une équation complexe du fait de la multiplication des prestataires, de demandes d’accès multiples, du développement de nouvelles sources de données via notamment les objets connectés et de règlementations conflictuelles [8].
- Intégrer l’éthique et une information claire et complète du patient tant pour l’acceptation du diagnostic et du traitement que pour l’exercice de ses droits sur ses données personnelles, est un gage essentiel de confiance dans la filière.
III Le Titre III du projet de loi adopté: la donnée de santé, futur eldorado numérique ?
Le volet de la transformation numérique du système de santé comprend 3 axes : la nouvelle plateforme des données de santé (art.11) ; la création de l’espace numérique de santé (art.12) ; le déploiement de la télémédecine et du télésoin (art.13). Nous n’envisageons dans cet article que les 2 premiers aspects.
- La future plateforme des données de santé (PDS) ou Health Data Hub
- Elle a vocation à réunir les données cliniques collectées par l’ensemble des professionnels de santé[9] dans le cadre de leurs activités liées aux soins remboursés, aux bases médico-administratives gérées par le SNDS (SNIIRAM, PMSI, BCMD, etc[10]), incluant les données traitées par les logiciels métiers des professionnels[11].
Toutes les données seront anonymes ou pseudonymisées de manière irréversible[12].
- L’accès aux données de la plateforme sera possible pour les traitements présentant un caractère d’intérêt public[13], et pas seulement des fins de recherche, d’étude et d’évaluation,ce qui devrait « permettre la constitution d’entrepôts de données de santé et de développer de nouveaux usages issus de l’IA » selon la DREES[14] et aussi limiter les autorisations d’appariements multiples demandées à la CNIL.
- La CNIL devra donner son autorisation pour tous traitements « concernant la santé », lesquels ne comprennent pas (i) les traitements des données des professionnels de santé du SNDS, mais (ii) incluent les traitements du NIR comme INS dans le cadre de bases de données (type entrepôt) utilisées à des fins ultérieures de recherche. Des traitements type pourront être encadrés par des référentiels et méthodologies de référence, dont la CNIL a déjà une bonne pratique.
La CNIL a indiqué dans son avis n° 2019-008 du 31 janvier 2019 qu’elle appliquera les principes de la loi Informatique et Libertés et du RGPD exigeant des finalités déterminées, explicites et légitimes et d’information/consentement du patient pour tous les traitements soumis à son autorisation. Elle prend acte également de l’augmentation probable de demandes d’autorisations de systèmes fils contenant des données issues du SNDS, dont la création pourrait être encadrée dans les textes d’application à venir.
- Le comité éthique et scientifique pour les recherches, études ou évaluations dans le domaine de la santé (CEIP), qui succède au CEREES, donnera son avis sur l’intérêt public de ces études.
- L’accès aux données pour des traitements de données de santé concernant la santé étant gratuit lorsqu’il est demandé par l’autorité publique ou pour des besoins exclusifs des services publics administratifs (art L 1461-5 CSP) et donc a priori payant pour les acteurs privés, la CNIL a insisté dans son avis sur l’importance de définir clairement le statut de chaque demandeur.
- La gouvernance de la plateforme sera constituée par un GIP constitué entre l’Etat, des entités représentant des patients et des usagers, des producteurs de données de santé, des utilisateurs publics et privés, y compris des organismes de recherche en santé. Il veillera notamment à l’élaboration de référentiels et méthodologies en collaboration avec la CNIL, promouvra des normes de standardisation et des appels à projets.
- L’usager gestionnaire de son Espace Numérique de Santé (ENS)
L’ENS est un compte personnel santé numérique de l’usager lui permettant de regrouper principalement ses données administratives, ses données de santé du DMP, ses données de remboursement et d’accéder à plusieurs services actuels et futurs (Améli, agenda, messagerie sécurisée…).
Dans le projet de loi, seul l’usager ou son représentant légal pouvait ouvrir ce compte. Le Sénat a opté pour une ouverture automatique et gratuite sauf opposition de l’intéressé. Le titulaire du compte en sera le seul gestionnaire et utilisateur ; il pourra paramétrer l’accès à son compte en le réservant à tel ou tel acteur de santé pour tout ou partie de son contenu, pour la durée et la ou les finalités de son choix. Il pourra aussi organiser des moyens d’authentification, d’accès partagé et d’extraction de contenus.
Dans son avis précité, la CNIL considère que cette offre d’un ENS est un traitement de données personnelles et qu’elle doit donc être consultée pour avis sur le futur décret en Conseil d’Etat qui précisera ses modalités. Elle souligne également que l’ENS en tant qu’agrégateur de services et de données, devra respecter les règles d’authentification, d’habilitation et de traçabilité définis pour chacun des services agrégés. Enfin, l’ENS devra être hébergé par un hébergeur de données de santé certifié.
Un décret en Conseil d’état déterminera les modalités de conception, mise en œuvre, administrtaion, hébergement et gouvernance de l’ENS au plus tard le 1er janvier 2022.
IV Un volet santé numérique riche de questions de fond
La médecine doit aujourd’hui
intégrer la transformation numérique et l’intelligence artificielle qui placent la donnée au cœur du système de santé et de ses progrès escomptés. La médecine
personnalisée s’épanouit paradoxalement grâce aux traitements de milliards de données de santé dont la définition évolue et qui sont progressivement
décloisonnées de leur conditionnement géographique, administratif et règlementaire. Les recommandations se multiplient pour canaliser les dérives[15] et dans un contexte international inexorablement innovant et compétitif, l’initiative
d’un Health Data Hub national est un premier pas encourageant pour promouvoir un modèle de plateforme fédérateur, collaboratif et sécurisé.
[1] Un large panel de représentants des professionnels de santé (praticiens, établissements) , d’entreprises du numérique (INRIA, Syntec Numérique ), d’institutionnels (CNIL, CNAM, …) et de chercheurs en IA ont ainsi échangé , sous la houlette de Gérard Longuet et Cedric Villani,[1] sur 2 thèmes principaux ; (i) nature, collecte, enjeux juridiques et protection des données de santé et (ii) les flux partant des soins vers les données et inversement.
[2] http://www.assemblee-nationale.fr/15/projets/pl1681.asp
[3] Institut National des Données de Santé qui accompagne les organismes désireux d’accéder aux données de santé pour des travaux de recherche, d’étude ou d’évaluation.
[4] L’INS (issu du NIR ou N° de SS) est l’identifiant obligatoire unique, utilisé pour référencer les données de santé et administratives des personnes prises en charge dans le champ sanitaire et médico-social .(art.L1111-8-1 CSP). Le décret n°2019-341 du 19 avril 2019 liste les traitements autorisés à utiliser le NIR.
[5] La FDA , Food & Drug Administration américaine a pour la 1ère fois autorisé l’usage d’un logiciel de diagnostic de troubles de la rétine, sans que l’image soit vue par l’ophtalmologiste. https://www.technologyreview.com/f/610853/fda-approves-first-ai-powered-diagnostic-that-doesnt-need-a-doctors-help/
[6] Il existe en France des bases spécialisées comme un réseau de tumorothèques, qui sont des banques d’échantillons biologiques de tumeurs, conservés à très basse température pour préserver des propriétés de l’ADN et de l’ARN de ces prélèvements. L’objectif est double : affiner les diagnostics et faciliter la recherche en cancérologie. Il existe aussi plusieurs entrepôts de données de santé : l’entrepôt de l’AP-HP ; France Life Imaging, qui est un réseau de partenaires en imagerie biomédicale ; DRIM France IA créé par le Conseil National de radiologie Française , évoqués lors de l’audition publique.
[7] Ce travail est commencé. Avec plus d’un milliard de feuilles de soins traitées chaque année par la CNAM et grâce aux travaux complexes menés depuis 4 ans en coopération avec Polytechnique pour restructurer la base de données du SNIIRAM, la CNAM a pu conduire des études démontrant les effets secondaires délétères de certains médicaments ou identifiant certaines pathologies à partir des prescriptions de médicaments.
[8] Voir la règlementation plus ou moins stricte sur le statut d’hébergeur de données de santé et les problématiques d’extraterritorialité des lois ( à propos de l’article 48 du RGDP et du Cloud Act américain).
[9] Professions médicales (chirurgiens-dentistes , sages-femmes, pharmaciens) et para médicales (infirmiers, kinésithérapeutes, pédicures-podologues), en secteur hospitalier et en médecine de ville
[10] SNIIRAM : Système National d’information inter-régimes de l’assurance maladie ; PMSI (Programme de médicalisation des systèmes d’information ; BCMD Base de données sur les causes médicales de décès. ; PIM (données des services de Protection Maternelle et Infantile) ; données de santé de la médecine scolaire. Le Sénat a ajouté le 6 Juin, les données sur les niveaux de perte d’autonomie des personnes âgées.
[11] Ne seraient a priori pas inclus dans la plateforme, les entrepôts de données constitués par des opérateurs privés et les études de cohortes en dehors de la prise en charge médicale ou d’actes remboursés. A cet égard, la cohorte Constances qui est une cohorte épidémiologique « généraliste » sur l’état de santé de la population française, pourrait cependant rejoindre le Health Data Hub. Cette cohorte réunit plus de 200 volontaires de 18 à 69 ans qui seront suivis toute leur vie.
[12] La conservation séparée des données permettant une ré-identification des personnes est supprimée.
[13] La référence aux « fins de recherche, d’étude ou d’évaluation » a été supprimée
[14] Direction de la recherche, des études, de l’évaluation et des statistiques des ministères sociaux (solidarités et santé, travail, action et comptes publics).
[15] Recommandation du Conseil de l’Europe sur les données de santé CM/Rec (2019) du 27 mars 2019
Avis du Conseil Consultatif National d’Ethique du 29 mai 2019 sur les « Données massives et santé :état des lieux, prospective et nouvelles questions éthiques » www.ccne-ethique.fr
Code of Conduct for data-driven health and care technology , 19 Fevrier 2019, UK Gov. https://www.gov.uk/government/publications/code-of-conduct-for-data-driven-health-and-care-technology/initial-code-of-conduct-for-data-driven-health-and-care-technology
Voir aussi le “discussion paper” de la FDA “Regulatory Framework for Modifications to Artificial Intelligence/Machine Learning (AI-ML)- Based Software as a Medical Device “ https://www.fda.gov/media/122535/download
0o0