Bandeau image

e-Science

e-Science

Partager

twlkfbml
Chapo
Le recours de plus en plus systématique à de gros corpus de données change en profondeur la pratique, les techniques du travail et jusqu'au mécanisme d'inférence, dans l'ensemble des disciplines scientifiques : la capacité à prédire des phénomènes est devenue centrale dans notre analyse des données scientifiques. Par ailleurs, dans certains domaines tels que la génomique ou les neurosciences, la révolution des techniques expérimentales a ouvert la porte à des jeux de données de très grande dimension mais avec un nombre d’observations limité. Un enjeu essentiel est d'accompagner ce changement en développant une culture de l'expertise des données au sein de l’Institut DATAIA pour la propager à l'ensemble des partenaires scientifiques.
Contenu
Corps de texte

Des données de plus en plus complexes

Sont présents sur le plateau de Saclay des domaines forts comme les sciences de la Physique et les sciences du vivant, qui, comme toutes les disciplines scientifiques génèrent par des expériences un grand nombre de données. Une grande partie du travail des scientifiques consiste à exploiter ces données : les stocker, les représenter, en extraire les informations utiles ou importantes puis faire de la modélisation, des modèles statistiques, des prédictions, les tester etc…

Ces données étant de plus en plus complexes, tous les scientifiques ne sont pas forcément outillés pour répondre aux défis posés par ces données,  qui deviennent de plus en plus techniques au fil du temps. Dans la continuité du travail commencé par le Center for Data Science de Paris-Saclay, l’Institut DATAIA propose des outils pour faciliter aux scientifiques l’analyse des données.

Créer de nouvelles méthodes d’analyse

Pour créer de nouvelles collaborations et dynamiser l’analyse des données,  une approche nouvelle consiste notamment à  soutenir la création de challenges pour repérer, pour un problème donné, les meilleures stratégies et les combiner pour arriver à un modèle d’ensemble plus performant.

Par exemple, dans le cadre du Center for Data Science, des chercheurs et ingénieurs de l’équipe Parietal du centre Inria Saclay – Île-de-France, ont lancé en 2018 un challenge sur l’autisme à partir d’images du cerveau d’enfants, autistes ou non.  Ainsi, des spécialistes en apprentissage mettent au point des modèles prédictifs pour le diagnostic de la maladie. Ce challenge a permis de faire avancer le score de prédiction et booster la qualité du diagnostic de l’autisme de 10 %. 

Dans le cadre des e-sciences, un autre type d’approche consiste  à établir la structure causale des phénomènes  plutôt que la prédiction : il s’agit d’une branche très active de l’apprentissage.

L’Institut DATAIA facilite les collaborations interdisciplinaires pour mettre au points de nouvelles approches pour résoudre les divers problèmes de Machine-learning (données manquantes, analyse causale, contrôle statistique etc.).
 

Aller plus loin

Contenus liés