Une cartographie des entrepôts de données de santé en France
Il est où mon rein ?
En tant que régulateur des données personnelles, la CNIL a observé l’augmentation des projets d’entrepôts de données de santé. Son laboratoire de recherche, le LINC, a entrepris de lister tous les entrepôts de données de santé situés en France pour les étudier et comprendre les dynamiques en cours. Il partage ses travaux via une carte permettant de les « matérialiser ».
Le laboratoire de la CNIL, le LINC vient de publier sa carte des entrepôts de données de santé (EDS) français. Celle-ci permet de voir la distribution géographique de ses entrepôts, mais aussi d’accéder à certains détails qui les caractérisent.
La CNIL rappelle, dans son communiqué à propos de cette carte, son rôle de régulateur des données personnelles en général. Mais, parmi ces données, celles concernant la santé sont reconnues particulièrement sensibles par le législateur via différentes lois.
On peut citer la loi sur le secret médical, la loi Informatique et Libertés, celle sur l’hébergement des données de santé, la mise à disposition des données de santé ou encore les interdictions de constitution et d’utilisation ou de cessions à des fins de prospection ou de promotion commerciales de certaines informations médicales.
L’autorité de contrôle doit donc particulièrement faire attention à l’utilisation de ces données de santé. Mais, si cette utilisation est très encadrée, elle est indispensable, notamment pour suivre les patients, faire de la recherche, administrer des institutions de soin, par exemple. Les « entrepôts de données de santé » permettent de stocker et de gérer ces données. « Ils peuvent être constitués tant par des acteurs publics (comme un établissement public de soin) que privés (comme un courtier de données ou une startup), sous réserve de respecter le cadre juridique applicable », explique la CNIL.
Une augmentation des projets
Elle explique avoir observé leur multiplication ces derniers temps ainsi que des organismes souhaitant en constituer (voir les deux graphiques ci-dessous). Son laboratoire, le LINC, a donc pris l’initiative de créer un outil « permettant à la fois de comprendre les dynamiques à l’œuvre et d’améliorer la transparence de l’usage des données de santé dans le cadre de la recherche ».
Dans une note plus détaillée, le LINC analyse un peu plus ce développement dont le début a été « assez lent, avec peu de projets sur les deux premières années (2017 – 2018) » mais qui a ensuite connu une « accélération à partir de 2020 avec une prépondérance des acteurs publics et un fort développement des entrepôts « généralistes » ». Le laboratoire de la CNIL explique aussi qu’à partir de 2022, il constate une « diversification des acteurs et des projets ».
Le LINC explique que cette diversification a été « facilitée notamment par la publication du référentiel entrepôt de données de santé l’année précédente (et donc la possibilité de se déclarer conforme), le secteur public se renforçant via des appels à projets et des mises en réseau ».
Il souligne aussi le cas de la plateforme AgorIA d’accès simplifié et sécurisé à de multiples Données de Santé en Vie Réelle (DSVR), qualifié de « notable puisque les co-responsables sont deux entreprises pharmaceutiques, une entreprise de conseil et d’innovation dans le secteur de la santé et une entreprise du secteur numérique, soit une co-responsabilité de quatre acteurs distincts pour un même entrepôt ».
Le laboratoire tient aussi à souligner un changement du côté des entrepôts de données de santé hospitaliers (EDSH) en citant le rapport de la HAS [PDF] sur le sujet : « Les premiers EDSH ont été conçus pour faciliter la construction de l’information hospitalière pour le financement ou le pilotage des établissements et pour des usages proches du soin. C’est aujourd’hui la finalité de recherche qui motive la construction et le développement des EDSH ».
Une concentration sur Paris peu étonnante
Le LINC souligne qu’à la mi-2024, « les acteurs responsables d’EDS en France sont localisés à 48,5% dans la région Ile-de-France, portée notamment par une présence plus grande d’acteurs privés (les sièges sociaux d’entreprises) et d’acteurs privés à but non lucratif (les sièges sociaux d’associations, de Centres de lutte contre le cancer – CLCC, etc.). Le secteur public y représente par ailleurs moins d’un tiers (27%), quand il représente pourtant 48% à l’échelle nationale ».
L’Auvergne-Rhône-Alpes vient en deuxième position, mais loin derrière, avec 9,5 %, « porté par des organisations privées à but non lucratif, composé de réseaux de recherche (Groupe Français de Pneumo-Cancérologie, Lymphoma Academic Research Organisation, Réseau des urgences de la vallée du Rhône) et du secteur public (CHU de Grenoble, Lyon et le CH d’Annecy Genevois) ». Il remarque que les tendances et répartitions sur le territoire « changent finalement assez peu au fil du temps, l’importance de la région parisienne se renforçant au fil du temps » et note l’absence du sud de la France.
Sur la carte de la CNIL, sont donnés, en plus de la localisation géographique du dépôt :
- le nom et une description de l’acteur gérant l’entrepôt ;
- le statut de l’acteur (public, privé ou privé à but non lucratif) ;
- le nom et une description de ou des entrepôts géré(s) par cet acteur ;
- la date de l’autorisation ou de déclaration de conformité de l’entrepôt (si applicable).
Un « rappel méthodologique et de lecture de la cartographie » est aussi fourni par le laboratoire.