«La France a une base de données médicales unique au monde»

INTERVIEW
Les milliards d’informations gérées par l’assurance maladie constituent un trésor peu accessible pour les chercheurs. Jean-Paul Moatti, économiste de la santé, plaide pour une ouverture plus large de ces fichiers médicaux, sous contrôle de la Cnil.

La question de l’utilisation des données de santé et des big data suscite un vif débat. Exemple le plus emblématique : le Système national d’information interrégimes de l’assurance maladie (Sniiram), qui contient plus de 10 milliards d’informations sur les prescriptions de médicaments, les consultations, les tarifs, les maladies, etc. Qui peut y avoir accès ? Les données de santé, pour ceux qui les détiennent, sont évidemment un formidable enjeu de connaissance, mais aussi de pouvoir. Comment les rendre accessibles, tout en préservant l’anonymat des usagers ? En France, des commissions se succèdent, des rapports aussi. On attend le prochain dans les jours à venir. La démocratie sanitaire va-t-elle investir ce champ des open data ? Ce jeudi soir, dans le cadre des «Jeudis de la santé» organisés par Libération, le débat est ouvert. Avec trois intervenants et un «grand témoin» (lire ci-contre). Jean-Paul Moatti, figure de l’économie de la santé, a été directeur de l’Institut de santé publique de l’Alliance des sciences de la vie et de la santé. Ses travaux ont porté sur l’évaluation économique des stratégies médicales innovantes en cancérologie et dans le domaine du sida, mais aussi sur l’analyse des comportements à risque pour la santé et de prévention. Il explique les enjeux du débat sur les big data.

On s’interroge beaucoup sur l’accès aux données de santé. Y a-t-il un réel enjeu ?

Oui. On s’intéresse de plus en plus, dans la recherche biomédicale, à ces big data, avec l’espoir de pouvoir travailler sur de gros échantillons. La France possède, à travers le Système national d’information interrégimes de l’assurance maladie (Sniiram), des données de consommation médicale concernant toute sa population, c’est quasi unique au monde ! Et celles-ci peuvent par ailleurs être reliées à d’autres fichiers, comme les fichiers hospitaliers, ou les données de mortalité de l’Inserm. Bref, nous possédons la base de données la plus exhaustive de la planète. L’inconvénient de cet avantage, c’est le caractère centralisé de notre système. Prenons l’exemple américain. Les Etats-Unis, avec la réforme de l’accès aux soins d’Obama, ont évidemment une foule de données avec les contrats d’assurances privées, mais il s’agit là de sources de données différentes, il est difficile de les utiliser en interactions, pour des raisons de cohérence et d’exhaustivité.

A quoi peuvent servir ces données ?

Premier cas de figure, l’assurance maladie : la simple analyse de ses bases de données médico-économiques par des chercheurs peut permettre d’observer beaucoup de choses. Si on avait pu lancer des études de pharmacovigilance, on aurait pu, par exemple, identifier bien plus tôt les méfaits du Mediator. En soi, l’information contenue dans ces bases peut donc se révéler passionnante. Elle est d’ailleurs souvent exploitée par l’assurance maladie pour guider ses décisions.

Second cas de figure, le chercheur : s’il sait qu’il peut avoir accès à ce type d’info, il peut concevoir des projets bien plus riches et inventifs. Savoir que l’on a accès aux données des prescriptions permet d’éviter de consacrer des moyens à des questionnaires portant sur des sujets sur lesquels on a déjà des réponses. Bref, le gain de productivité dans la collecte des données utiles à la recherche est important.

Enfin, troisième cas de figure - c’est là le plus difficile -, quand nous avons notre propre collecte de données, sur un certain nombre de caractéristiques dans un groupe d’individus, on peut, a posteriori, apparier ces données avec celles de l’assurance maladie. Et, à ce moment-là, faire parler ou tester certaines hypothèses. Les Etats-Unis arrivent ainsi à prévoir de manière très précise la consommation médicale dans telle ou telle région.

Et en France ?

Avec les grandes cohortes récemment mises en place dans le cadre des investissements d’avenir ou des grandes enquêtes de santé, la possibilité de rapprocher les données sociales, biologiques ou cliniques collectées avec les données de l’assurance maladie permet de faire des analyses plus fines et performantes.

On voit l’intérêt en termes de santé publique, où sont donc les blocages ?

Les réglementations sont lourdes, difficiles, et c’est compliqué pour les chercheurs - comme d’ailleurs pour les autres acteurs de la santé - d’accéder à ces données.

Mais est-ce possible ?

Oui. Prenons le cas le plus facile : l’assurance maladie a déjà une sorte de fichier réduit d’enquête générale sur les bénéficiaires. Pour y avoir accès, nous, chercheurs, passons par des procédures relativement simples. Mais tout se complique quand on cherche à apparier les données de l’assurance maladie avec d’autres données recueillies par ailleurs. Bien souvent, il faut un décret du Conseil d’Etat pour l’autoriser. Cela prend des années, comme on l’a vu récemment pour la cohorte Nutrinet sur la nutrition.

Sur cette question, quelle est l’attitude de l’assurance maladie ?

La Sécu s’efforce déjà de répondre aux demandes mais elle est dans une situation paradoxale : elle n’est pas «payée» pour cela. On lui demande un service public supplémentaire. Ce n’est pas en soi son rôle. En plus, il faut faire sauter des verrous réglementaires et juridiques pour simplifier l’accès. Enfin, tout cela nécessite un gros investissement en plateformes techniques adaptées pour permettre de traiter ces données en toute conformité, avec des hauts niveaux de sécurité. Cela dit, tout cela est possible. Au Danemark, un système de ce type marche déjà très bien.
Il n’y a pas de blocage de la Sécu qui ne voudrait pas ouvrir ces données…

Non. En tout cas, s’il y en a eu dans le passé, ce n’est pas le cas maintenant. Mais il y a des règles, et, dès lors que l’on respecte les procédures, les chercheurs finissent par avoir accès aux données. L’enjeu est de pouvoir y accéder plus vite et plus systématiquement. Aujourd’hui, à peine une petite centaine de publications scientifiques annuelles utilisent ces données, alors que des milliers pourraient le faire.

Certains s’inquiètent du respect de l’anonymat et de la confidentialité.

Question importante. En même temps, ne créons pas de fantasmes. Il y a deux cas de figure ; les données anonymisées (par exemple des données de consommation par zones géographiques). Elles sont sans risque pour la vie privée. Ces données, a priori, n’ont aucune raison de ne pas être rendues publiques le plus largement possible. Certains chercheurs ou décideurs avaient des réticences, craignant un mauvais usage. Mais c’est le lot de l’information, il faut laisser jouer le pluralisme : sur l’utilisation de ces données anonymes, l’accès simple et général paraît s’imposer.

En revanche, souvent pour faire de la recherche de pointe, il faut que l’on ait des données individuelles qui, même correctement rendues anonymes, peuvent être indirectement nominatives (on peut retrouver de qui il s’agit). Et là, il peut y avoir un risque. A ma connaissance, il n’y a eu aucun cas d’atteinte à la vie privée lié à la recherche sur ces types de données en France, mais c’est vrai que ce risque existe objectivement et qu’il faut trouver un bon équilibre pour le minimiser. C’est possible techniquement. De toute façon, c’est la Commission nationale de l’informatique et des libertés (Cnil) qui a et qui aura toujours le dernier mot.

Ces données peuvent-elles avoir une valeur économique ?

Bien sûr. Des informations détaillées sur des prescriptions médicales peuvent intéresser les laboratoires pharmaceutiques et beaucoup d’autres branches. C’est pourquoi il est normal qu’il existe des instances, en amont de la Cnil, capables de juger si une demande d’accès est techniquement viable et si son bénéfice collectif surpasse ses risques éventuels. Dans le cas de la recherche académique, nous avons défendu l’idée qu’il faudrait instruire techniquement ces demandes dont l’objet est de produire de la connaissance ouverte à tous. Il s’agit d’un bien collectif.

Il peut arriver aussi que, dans la recherche, il y ait des partenariats publics-privés et il faut tenir compte de ces situations. De toute façon, il faudra trouver un moyen de financer le système d’accès à l’information et personne ne conteste que le tarif des prestations soit différencié selon la nature et le choix du demandeur.

Les associations de patients semblent avoir une position différente.

Non sans raison, les associations de patients n’avaient pas trop envie que le système de gouvernance soit par trop subordonné à l’expertise technico-scientifique. Et, inversement, le monde de la recherche ne voulait pas être dépendant d’un système qui serait soumis à de multiples interférences socio-économiques. La convergence peut se trouver facilement.

Aujourd’hui, le dossier avance-t-il ?

Pendant ces six derniers mois, le dossier a bien avancé. Le rapport final de la commission open data va dans le bon sens. On l’attend. Il y a un consensus pour simplifier les procédures et pour qu’il y ait un guichet unique; les convergences sont réelles entre les acteurs. La ministre de la Santé, Marisol Touraine, s’est déjà engagée à tenir compte des propositions de ce futur rapport dans son projet de loi sur la santé publique qui sera discuté au Parlement cet automne.

ÉRIC FAVEREAU
Source

Contactez nos experts