Institut DATAIA
Science des données, Intelligence Artificielle et Société

DATAIA Institute
Data Science, Artificial Intelligence and Society

Retour en images sur
la journée de lancement du 15 février
L'écosystème


L’écosystème de l’Institut DATAIA compte plusieurs projets soutenus par le Programme d’Investissement d’Avenir (PIA) dans le domaine des données au sein de l’Université Paris-Saclay. L’Institut DATAIA s’appuie sur les communautés déjà actives au sein du Labex Digicosme (axe « datasense »), des Equipex Digiscope, FIT et CASD ainsi que de la plateforme TERALAB.

L’Institut DATAIA s'adosse également aux communautés multidisciplinaires déjà existantes à travers les projets financés par l’Université Paris-Saclay : l’Institut de la Société Numérique (ISN), le « Center for Data Science » (CDS/CDS2), l’Institut du Contrôle et de la Décision (iCode/iCode2), NutriPerso (Alimentation et santé) ainsi que les deux chaires dédiées au « Big data ».

OBJETS D’EXCELLENCE PIA

Digicosme
DigiCosme est un laboratoire d’excellence (LabEx) en Sciences du Numérique. Porté par l'Université Paris-Saclay et ses établissements membres, il implique les laboratoires partenaires communs comme : LRI (U. ParisSud/UMR CNRS), LIMSI/CHM (UPR CNRS), LIST (CEA), LTCI (Télécom Paristech/IMT), MICS et L2S (CentraleSupelec), UMR CNRS), LIX (Polytechnique, UMR CNRS), INRIA-Saclay, SAMOVAR (TélécomSudParis/IMT, UMR CNRS), et DAVID (U. Versailles-Saint-Quentin). Sur le plan scientifique, trois thématiques au cœur de la conception des systèmes d'information et de communication sont développées : la fiabilité et la sécurité, la gestion des réseaux et la science des données.

C'est avant tout ce dernier thème qui est directement lié à l'Institut de convergence d'autant plus qu'il implique directement les mêmes équipes STIC compétentes en science des données, de la gestion des données en passant par l'apprentissage automatique et l'intelligence artificielle. On trouve également dans le thème de la fiabilité et de la sécurité des centres d'intérêts communs avec la science des données comme par exemple la fiabilité des algorithmes et la sécurité des systèmes.

Ecodec
Le LabEx Ecodec « Economie et sciences de la décision", piloté par l’ENSAE-CREST avec l’Ecole polytechnique et HEC, est un élément fondateur d’un grand pôle d’économie, management et sciences sociales d’un très haut niveau international rassemblant plus d’une centaine d’enseignants-chercheurs en économie et en statistique de l'ENSAE ParisTech, de son centre de recherche -le CREST- de l’Ecole polytechnique et de HEC, en lien étroit avec les établissements de l’Université Paris-Saclay tels que l’ENS Paris-Saclay, l’Université Paris-Sud, le CEA, AgroParisTech ou encore l’INRA. Son défi principal est de réguler l’économie au service de la société.

Ecodec comporte un axe transverse en lien direct avec les sciences des données « New Challenges for New Data». Cet axe étudie les nouvelles questions statistiques et économiques qui surgissent avec l'émergence des nouvelles sources de données créées par notre économie mondiale. Ces masses de données, en effet, sont nécessaires pour une évaluation appropriée ou une société plus transparente. Elles créent simultanément de nouvelles opportunités, mais aussi de nouvelles menaces, toutes étudiées dans ce domaine.

Ecodec comporte plusieurs enseignants-chercheurs en commun avec l’Institut DATAIA et naturellement envisage des actions scientifiques communes comme les invitations des chercheurs, l’organisation de séminaires et des doctorants et post-doctorants en commun.

Digiscope
Digiscope est un équipement d'excellence (Equipex) fondé en 2011 pour la visualisation à grande échelle de phénomènes complexes, supportant la coopération uni- ou multi-site des utilisateurs. Il a les partenaires communs suivants : Univ. Paris-Sud, Univ. Versailles Saint-Quentin, TelecomParistech, Centrale Supelec, CNRS, CEA, INRIA qui collaborent à travers 10 plates-formes murs d'image et un réseau de téléprésence.

Les objectifs scientifiques de Digiscope, dont la portée est étendue dans le cadre des deux ERCs de Wendy Mackay et de Michel Beaudouin-Lafon, s'inscrivent pleinement dans les visées pluri-disciplinaires de l’Institut DATAIA. En premier lieu, les recherches conduites dans le cadre de Digiscope ont pour but de rendre aux experts et aux utilisateurs le pouvoir sur les données, tirant parti sans perte en ligne des connaissances du domaine pour la visualisation et la manipulation collaborative des données. En second lieu, les actions des experts définissent un corpus de traces qui peut être exploité pour extraire et transmettre les connaissances du domaine et les préférences des experts.

L’interaction machine centrée sur l'humain fait partie des objectifs de l'Institut DATAIA et les partenaires de DigiScope sont des membres du premier cercle de l’Institut DATAIA (U. Paris-Sud, INRIA, CEA, TelecomParisTech, CNRS). La collaboration entre Digiscope et l’Institut DATAIA d'ores et déjà actée concerne l'usage pour les applications de l’Institut DATAIA, des murs d'image Digiscope étendant le catalogue de cas d'usage de Digiscope. Un mode de collaboration plus étroit est envisagé pour développer conjointement le concept de Wall As A Service, en factorisant les moyens humains, critiques pour l'utilisation et la vie effective des plateformes.

Idex Paris-Saclay
L’Idex Paris-Saclay finance plusieurs initiatives structurantes à l’échelle des partenaires de l’université Paris-Saclay et qui sont en synergie avec l’Institut DATAIA tant avec les objectifs scientifiques en commun qu’avec le personnel scientifique impliqué.

CDS2
CDS2 vise à développer des méthodes et des outils pour analyser des quantités gigantesques de données et en extraire des informations utiles pour tous les domaines scientifiques. Ce projet comprend des recherches sur les méthodologies analytiques (statistiques, processus d'apprentissage par machine, extraction de connaissances, visualisation de données), ainsi que sur la conception de logiciels. Les projets les plus typiques au sein de CDS2 sont les actions rapides d'analyse et de prototypage de modèles (RAMP), qui sont des défis collaboratifs en sciences des données qui augmentent la compétence des participants.

Ces objectifs sont donc axés sur des aspects méthodologiques et algorithmiques, mais hautement synergiques avec les actions de l’Institut DATAIA, qui aborde à la fois les développements scientifiques, méthodologiques et les applications en plus d’avoir plusieurs enseignant-chercheurs en commun.

Nutriperso
Nutriperso, Initiative de Recherche Stratégique multidisciplinaire (INSERM, INRA, Agro-ParisTech, CEA, CNRS, INRIA, U. Paris-Sud, TelecomParisTech), a pour objectif la recommandation personnalisée de régime alimentaire en vue d'un meilleur bien-être et d'une meilleure santé. Les cibles spécifiques concernent la prévention de diabète de type 2, et la prévention, par exemple de carences lors du passage en retraite.

Les objectifs de Nutriperso s'inscrivent pleinement dans la visée de l'Institut DATAIA. En premier lieu, une partie significative des recherches (3 jalons sur 5) repose sur la science des données, visant : i) la caractérisation des risques individuels; ii) la caractérisation des tribus alimentaires et du risque associé; iii) la recommandation de modifications de diète individuelle. En second lieu, ces objectifs sont par nature pluri-disciplinaires (sociologie, économie, épidémiologie, biologie, en plus de la science des données); la recommandation de modifications individuelles de diète requiert une prise en compte intégrée de l'acceptabilité (individuelle et économique) de ces modifications, ainsi que les effets des substitutions sur le bilan nutritionnel global.

Les personnes expertes en science des données de Nutriperso sont des membres actifs de l'Institut DATAIA (CEA, CNRS, INRIA; 2 membres du comité scientifique de l’Institut DATAIA). Nutriperso (2016-2018) a vocation à terme à s'intégrer dans l’Institut DATAIA, et démarrer un pôle alimentaire/santé en apportant son réseau de partenaires scientifiques et industriels (Danone).

iCode2 ( Institut for Control and Decision of Paris Saclay)
iCODE a pour but de fédérer la recherche, le transfert technologique, la formation et la diffusion de l’Automatique et de la Décision sur le plateau de Saclay. Les thématiques scientifiques d’iCODE s’articulent autour de quatre pôles « challenges » : Energy – Eco – Exo – Neuro Cette initiative permet d’unifier la communauté des spécialistes de la théorie du contrôle, puis de partager leurs recherches avec d’autres disciplines comme la physique, les mathématiques, la chimie, la biologie, l’informatique, et l’économie.

Une quarantaine de projets sont financés depuis mars 2014, rapprochant des équipes de l’UVSQ, l’ENSTA ParisTech, le CEA, l’Onera et les autres membres de l’IDEX. 80 chercheurs issus de 23 laboratoires membres de l’Université Paris-Saclay se réunissent au sein du Laboratoire de l’IDEX Paris-Saclay (Lidex) iCODE pour rendre visible leurs thématiques.

iCODE se décline en 2 phases (1 /2014 au 2016, et la deuxième phase Novembre 2016 au Juin 2019).

MSH
La MSH (Maison des Sciences de l’Homme) Paris-Saclay affiche deux ambitions : promouvoir l’interdisciplinarité et fédérer les forces SHS de l’Université Paris-Saclay. Elle est présente sur le site de Saclay avec 1200 permanents (C, EC et ITA) et 800 doctorants dans environ 37 unités SHS. La MSH, en s’appuyant sur la cartographie qu’elle a élaborée permettra de fédérer les chercheurs SHS travaillant sur les axes de recherche de l’Institut DATAIA.

La MSH partage plusieurs enseignants-chercheurs avec l'Institut DATAIA, qui ont déjà collaboré ensemble dans le cadre notamment de l’institut de la société numérique (ISN) qui a contribué à l’émergence de l’Institut DATAIA. De plus, l’Institut DATAIA porte une recherche pluridisciplinaire sur les données et les algorithmes, en articulation parfaite avec le premier axe de la MSH (numérique et humanités), qui regroupe 400 chercheurs et doctorants SHS travaillant sur les données massives, les algorithmes et la décision ; avec le deuxième axe de la MSH (environnement et santé) qui regroupe plus de 300 chercheurs et doctorants SHS ; avec le troisième axe de la MSH (transition et innovation), qui regroupe les transitions numériques et écologiques, les enjeux des data étant présents sur les trois axes.

Institut Pascal
L’institut Pascal est le nœud de Paris-Saclay dédié aux échanges inter-disciplinaires sur un temps long et à l’échelle internationale, à l’instar de l’Institut Henri Poincaré. Ses activités sont centrées sur l’organisation de programmes thématiques réunissant pour quelques semaines ou quelques mois des scientifiques au croisement de plusieurs disciplines (de la physique à l’informatique, en passant par les maths, la biologie et la chimie), pour explorer des champs émergents et/ou lancer des réseaux de coopération internationale.

L’Institut Pascal et l’Institut DATAIA bénéficieront de dynamiques d’échanges croisés, dans le but d’attirer des scientifiques et des étudiants du monde entier à l’interface de leurs domaines respectifs. Une première proposition à l’intersection des deux Instituts est d’ores et déjà en cours sur le domaine de la modélisation causale en physique des hautes énergies.

SystemX
L’Institut de Recherche Technologique (IRT) SystemX a été labellisé le 1er février 2012 dans le cadre du programme d’investissement d’avenir, mis en place dans le but de soutenir l’innovation en France. Unique IRT en Île-de-France, il adresse les domaines de l’ingénierie numérique des systèmes du futur, SystemX répond aux défis technologiques d’aujourd’hui au moyen d’une innovation flexible, ouverte et collective.

L’objectif de l’IRT SystemX est l’intégration des briques technologiques, développées au sein des laboratoires académiques partenaires, qui constituent le support à une dissémination des résultats aux partenaires industriels de l’IRT tout en contribuant à une visibilité nationale et internationale des activités de recherche.

L’IRT constitue donc un chainon important pour l’Institut DATAIA permettant de favoriser la valorisation de ses résultats dans l’écosystème industriel. Les chercheurs de l’Institut DATAIA pourront donc naturellement promouvoir leurs résultats dans des projets de valorisation de l’IRT. Des liens pourront être créés entre le club d’industriels affiliés de l’Institut DATAIA et l’IRT pour favoriser ce passage de la recherche à l’innovation.

INTEGRATION DU PROJET DANS LA STRATEGIE DE RECHERCHE ET DE FORMATION DU SITE

Pôle de compétitivité Cap Digital
L'Institut DATAIA s’appuie sur des partenariats avec Cap Digital pour valoriser les recherches issues de l’institut vers les entreprises de l’écosystème du pôle, pour connecter les entreprises adhérentes au pôle aux projets et aux chercheurs de l’institut, pour co-construire des appels à projets spécifiques (use case, data set etc..) avec la région, les territoires, les grands groupes, et les start ups, pour monter des programmes de formation pour les PME sur les technologies et les enjeux autour des données, pour organiser des workshops et identifier les thématiques data pertinentes pour les partenaires du pôle, en particulier les grands comptes.

Systematic
La plupart des partenaires de l’Institut DATIA sont membres du pôle de compétitivité Systematic et sont très impliqués dans sa gouvernance. Cela crée une proximité avec l’ensemble des membres du pôle qui permettra de les connecter avec l’Institut DATAIA. Déjà des membres du pôle ont manifesté leur intérêt pour participer à la communauté des partenaires industriels de l’Institut DATAIA. En particulier, ils pourront apporter leur vision des orientations stratégiques de l’Institut DATAIA ainsi que des propositions de « use-cases ».

Les membres du pôle seront également les premiers bénéficiaires des programmes de formations qui seront initiés par l’Institut DATAIA. Enfin, l’Institut DATAIA pourra profiter de l’action « Ambition PME » du pôle pour valoriser ses résultats de recherche.