Le big data : une ressource pour lutter contre le cancer ?
En France, les cancers représentent la première cause de décès chez l’homme et la deuxième chez la femme1. En 2018, le nombre total de nouveaux cas de cancer est estimé à 382 000, et celui des décès par cancer à 157 000. Du fait du vieillissement de la population, le nombre de nouveaux cas devrait augmenter d’environ 47 % au cours des vingt prochaines années2. Cette multitude de patients génère une profusion de données hétérogènes (traitements, évolution des maladies, effets constatés…), qui constituent un ensemble d’informations que l’on nomme big data. Ces exaoctets d’informations pourraient permettre une meilleure compréhension de la maladie, et ouvrir sur une optimisation des traitements. Une perspective prometteuse, qui passe d’abord par des défis colossaux.
Cancer : un mot qui cache une réalité multiple
Le terme « cancer » est générique et désigne des centaines de maladies différentes. En effet, une seule tumeur peut contenir des milliards de cellules, et chacune d’elles a la capacité de se modifier et de muter de façon incontrôlée. De division de cellules en division de cellules, au gré de la croissance et du développement de la tumeur, il résulte un grand nombre de variations au niveau du génome tumoral.
3 niveaux d’analyse des données
Données biomédicales des patients, données génétiques, données cliniques et biologiques, données familiales ou encore données environnementales (alimentation, niveau de pollution)… Le nombre de données existantes et à venir est abyssal. Actuellement, les chercheurs utilisent majoritairement ces données pour analyser la maladie à trois niveaux :
- Cellulaire : les progrès et les découvertes au niveau de l’analyse des cellules cancéreuses et des biomarqueurs génétiques pourraient aider à prédire les modifications génétiques et à adapter l’approche thérapeutique.
- Patient : les antécédents médicaux du patient, les données relatives à son ADN, la comparaison avec d’autres patients présentant des pathologies et des caractéristiques génétiques similaires pourraient être utilisés pour définir la meilleure association thérapeutique pour le patient.
- Population : des données épidémiologiques couvrant des populations à plus large échelle peuvent permettre de déterminer des stratégies thérapeutiques en fonction des modes de vie, des situations géographiques et des types de cancers.
L’objectif est de permettre aux oncologues de fournir à chaque patient un traitement médical personnalisé, ciblant ses cellules cancéreuses spécifiques et limitant le risque d'effets secondaires graves.
Une ressource en construction
Le défi réside moins dans l’accumulation de données relatives aux patients que dans la capacité à les partager, à les structurer correctement puis à les analyser efficacement. Il n’existe pas plus de remède universel pour le cancer qu’il n’existe d’outil unique pour analyser les données.
Les chercheurs et les informaticiens doivent constamment se remettre à la page. À peine ont-ils conçu les nouveaux outils et les nouvelles techniques nécessaires au traitement efficace de toutes ces informations, que de nouvelles sources de données apparaissent. En outre, les données ont pendant longtemps été répertoriées sur différentes plateformes et, même si l’utilisation de clouds de data a connu un essor considérable ces dernières années, la manière optimale de coordonner et d’organiser ces clouds reste à définir.
9
C'est le nombre de propositions du HDI pour permettre une exploitation intelligente et citoyenne des données de santé
Le pouvoir du savoir collectif
Pour traiter ce volume de données personnelles et développer des outils logiciels permettant de leur donner du sens, les chercheurs misent de plus en plus sur les stratégies collaboratives. De nombreux collectifs œuvrent dans ce sens, dont le Healthcare Data Institute (HDI)3 qui rassemble des acteurs mondiaux de la santé et dont Bayer est un membre actif.
Le HDI a notamment défini 9 propositions pour permettre une exploitation intelligente et citoyenne des données en santé. Parmi elles, des préconisations pour établir une stratégie unifiée et transparente, avec un comité mandaté pour identifier les axes d’exploitation des données de santé.
Accélérer les parcours réglementaires, préserver un niveau élevé de protection des données, informer les citoyens des objectifs du partage de données et de la sûreté de celles-ci, accompagner les professionnels, informer des recherches permises par la mutualisation des données, font également partie des priorités à mettre en place pour développer une approche ambitieuse du soin.
Si la médecine du 20e siècle portait sur la quête de données, le 21e siècle porte sur la coopération qui permettra de mieux les utiliser, au service de la santé du plus grand nombre.
COR-CON-FR-0035-2