Données

Data Scientist en santé, la perle rare

Par
Publié le 18/08/2022

Est-ce une mission impossible de recruter un data scientist dans le secteur de la santé ? Oui, si l’on considère la situation tendue du marché, les difficultés de recrutement et l’absence de modèle économique. La surrèglementation autour du travail de la donnée vient alourdir la situation. Quelles sont les solutions ? Republication de notre dossier paru en mars dernier.

Crédit photo : GARO/PHANIE

« Recherche data scientist en oncologie. » Cette offre présentée par la DSI de l’AP-HP a été publiée il y a quelques semaines sur des sites de recrutement. On ne sait si elle a trouvé preneur. Pour autant, le métier de data scientist est-il nouveau sur le marché ? Pas tant que ça, selon Delphine Maucort-Boulch, professeur de biostatistiques (faculté Lyon Sud) et chef du pôle santé publique (HCL), « sous le label data scientist, il y a une pluralité de compétences qui viennent enrichir le statisticien que l’on a connu auparavant. En fait, nous renommons au fil du temps les termes en fonction de l’évolution de l’écosystème. » Ces propos sont repris par Pascal Staccini, professeur d’informatique médicale et responsable d’un master d’ingénierie de la santé à l’Université Côte d’Azur de Nice selon lequel l’ancêtre de la data science était le data mining et l’ancêtre du data mining est la biostatistique. Comme l’indique le professeur Pascal Roy, responsable du parcours biostatistique, biomathématique, bioinformatique et santé (B3S) du master de santé publique de l’université Lyon-1 : «Pour répondre au défi du numérique en santé, notre nouvelle maquette de master renforce considérablement la part du numérique et de l’IA en 2022. Cette ouverture s’appuie sur le partenariat tripartite associant les Hospices civils de Lyon, l’université Claude-Bernard Lyon 1 et l’Ecole Centrale pour former aux nouveaux métiers de la santé, ayant déjà conduit à la mise en place d’un diplôme original de médecin/ingénieur. L’intégration médicale des évolutions technologiques nécessite de développer des formations aux métiers d’interface. » Au-delà des termes, c’est bien le marché très en tension en tant que tel du métier qui agite les acteurs.
 

Absence de modèle financier

Car même si la plateforme des données de santé (Health Data Hub) a été créée par arrêté du 29 novembre 2019, l’État n’a toutefois pas encore accordé les moyens nécessaires pour mettre en place les entrepôts de données de santé dans l’Hexagone. En d’autres termes, les établissements hospitaliers doivent prendre sur leur budget pour pouvoir financer la création de projets autour de la donnée. Cécile Chevance, responsable du pôle offre à la Fédération hospitalière de France (FHF) décrit la situation. Selon elle, « il manque un modèle de financement de structure qui soit pérenne avec des crédits Merri qui permettraient d’amorcer la mise en place d’entrepôts de données de santé et de recruter les compétences rares et chères dont nous avons besoin ». Deuxième piste de financement, la fabrication d’un modèle économique qui permette de valoriser le travail de mise en ordre et d’exploitation de la donnée. Rien ne serait plus simple que de mettre toutes ces données dont nous disposons en masse « tout en bazar et non exploitées ». Mais le plus difficile est de structurer ces données, d’en homogénéiser les libellés et les usages. Toutes ces étapes demandent du temps et donc de l’argent et elles ne peuvent être réalisées que par des experts formés ad hoc.

Profil peu développé à l'hôpital

Le profil qui colle parfaitement pour le poste est celui d’un ingénieur informatique qui se spécialise dans la santé, souvent au contact d’un médecin féru de méthodologie statistique. Historiquement, cela se tient. L’informatisation à l’hôpital a été portée par des médecins un peu visionnaires et charismatiques qui ont très vite pensé qu’on pouvait améliorer les pratiques et la qualité des soins via l’informatisation. Selon Julien Guérin, responsable de la Data Factory à l’Institut Curie, « les médecins qui ont une connaissance parfaite de la culture métier, du dossier médical, devront être accompagnés régulièrement de data scientists. Ce profil est communément répandu dans la recherche médicale, mais il est encore très peu développé dans le milieu hospitalier. »
Alors, si de telles difficultés de recrutement existent, il faudrait pouvoir répondre aux besoins en matière d’offre. Seulement les écoles commencent seulement à se créer. Selon David Gruson (Ethik IA), « des data scientists seront recrutés par les hôpitaux dans les écoles générales de data sciences ou les écoles générales de préparation à l’ingénierie algorithmique de manière transverse, puis se spécialiseront en interne dans leur établissement par la suite ».

Tension du marché

Une solution pour assurer une spécialisation dans la santé plus rapidement est déjà envisagée par certains acteurs. En témoigne Laure Maillant, directrice du pôle innovations et données de la DSI de l’AP-HP, institution qui a mis en place un entrepôt de données de santé mutualisé entre tous ses hôpitaux : « Pour compenser cet écart, nous travaillons avec les filières de formation d’ingénieurs comme Centrale Supélec ou EPITA pour que la problématique des données de santé soit abordée plus tôt durant leur cursus. »  
Un autre inconvénient résulte de cette tension du marché des data scientist, la fuite des cerveaux. Ce dont témoigne Cécile Chevance (FHF), selon laquelle les ingénieurs informaticiens sont formés dans les établissements hospitaliers et une fois devenus experts « partent vendre très cher leurs compétences acquises en tant que chefferie de projet ». Toutefois, explique-t-elle, « les hôpitaux publics ont des profils de postes et de compétences très intéressants dans le domaine de la donnée et de l’IA et cherchent à recruter ».

Surrèglementation

Enfin, la surréglementation. Critiquée par tous les acteurs, elle vient alourdir le fardeau des procédures. Marc Cuggia, responsable du centre de données cliniques du Chu de Rennes, voit une surenchère considérable depuis la mise en œuvre du RGPD, pas seulement pour travailler les données, mais dans l’ensemble du fonctionnement de l’hôpital. RSSI, DPO, cliniciens, chercheurs : « Tout le monde est au bord de la crise de nerfs. » L’analyse des risques, la constitution de commissions, de revoyures engloutissent les budgets pour mettre en œuvre les projets. Et d’appeler au développement de méthodologies et de références qui viendront simplifier le processus de validation de la donnée. Le nombre d’agences intervenant dans la donnée (Cnil, Agence du numérique en santé, Cnam, Santé publique France, Inserm...) serait en cause, mais aussi la complexité juridique dans la mission des data scientists qui n’ont pas d’autre choix que de travailler main dans la main avec des experts juridiques. Les acteurs ne remettent pas en question pour autant la nécessité de protéger le circuit de la donnée personnelle des patients. Mais ils appellent à clarifier les textes. Au bout de la chaîne de la donnée, les protagonistes sont-ils découragés ? Non, car ce sont des passionnés. Mais pour ne pas perdre leur confiance, il faudra des changements. L’élection présidentielle sera-t-elle l’occasion de le faire ?

 

 

* La Cnil a publié un référentiel de simplification des procédures en novembre 2021 permettant aux organismes qui s'y conforment de mettre en œuvre un entrepôt de données sans solliciter d’autorisation préalable auprès de la Cnil. Une avancée.


Source : lequotidiendumedecin.fr