Bandeau image

Les priorités scientifiques

Les priorités scientifiques

  • APPRENTISSAGE ET INTELLIGENCE ARTIFICIELLE
  • DES DONNÉES AUX CONNAISSANCES, DES DONNÉES À LA DÉCISION
  • TRANSPARENCE, IA RESPONSABLE ET ÉTHIQUE
  • PROTECTION, RÉGULATION ET ÉCONOMIE DE LA DONNÉE

Partager

twlkfbml
Chapo
L’Institut DATAIA s’appuie sur des socles disciplinaires tels que la statistique, la stratégie, la science des données, le droit, etc... et relève des défis interdisciplinaires pour propager son expertise à l'ensemble des partenaires scientifiques.
Contenu
Ancre
APPRENTISSAGE ET INTELLIGENCE ARTIFICIELLE
Corps de texte

Récemment, la recherche en apprentissage profond a réalisé des avancées spectaculaires en vision par ordinateur et en traitement du langage naturel. Au-delà de l'arrivée des données massives, de l'accroissement de la puissance de calcul et des efforts de conception, les causes de ces progrès, encore mal connues, soulèvent au moins trois questions.

Quelle théorie de l'apprentissage permettra d'analyser les architectures profondes ?

Comment gérer la compositionnalité de ces architectures et leur capacité à appréhender des objets plus complexes ?

Comment ouvrir la boîte noire pour mettre à jour les représentations apprises ?

Challenges :

  • Apprentissage automatique innovant et IA : sens commun, adaptabilité, généralisation 
  • Apprentissage profond et apprentissage adversarial
  • Apprentissage automatique et hyper-optimisation
  • Optimisation pour l’apprentissage, e.g. améliorations des méthodes de gradient stochastiques, optimisation Bayésienne), optimisation combinatoire
  • Lien apprentissage-modélisation, intégration d’à priori dans l’apprentissage
  • Reproductibilité et apprentissage robuste
  • Inférence statistique et validation
  • Compositionnalité des architectures profondes.
Ancre
DES DONNÉES AUX CONNAISSANCES, DES DONNÉES À LA DÉCISION
Corps de texte

La disponibilité croissante de données massives repousse les frontières techniques dans de nombreux champs. D'une part, la nature hétérogène, semi-structurée, incomplète ou incertaine des données remet en cause les modèles statistiques usuels ainsi que les algorithmes dédiés à la décision. D'autre part, la gestion des données soulève de nouvelles contraintes d'opérabilité telles que la sécurité, l'intégrité et la traçabilité.

En outre, produire de la connaissance nécessite de construire des modèles qui fournissent des décisions explicables, statistiquement valides et calculables. L'acceptation des résultats requiert aussi que la confidentialité et la loyauté soient renforcées.

En parallèle, de nouveaux développements en optimisation doivent permettre d'améliorer les procédures d’estimation.

Challenges :

  • Données hétérogènes, complexes, incomplètes, semi-structurées et/ou incertaines
  • Fast big data : structuration de la donnée pour pouvoir l’exploiter
  • Apprentissage en ligne, méthodologie pour les données massives, méthodes efficientes
  • Amélioration du stockage, calcul et estimation pour la science des données
  • Modélisation des interactions entre agents (humains ou artificiels) par théorie des jeux.
  • Représentation et algorithmes multi-échelle et multimodaux
  • Analyse théorique de méthodes heuristiques (théorie de la complexité, géométrie de l’information, théorie des chaînes de Markov)
  • Coévolution Humain-Machine dans les systèmes autonomes : agents conversationnels, voitures, robots sociaux
Ancre
TRANSPARENCE, IA RESPONSABLE ET ÉTHIQUE
Corps de texte

La confiance numérique s'instaure à partir de l'implantation de méthodologies éthiquement responsables à travers la transparence et la redevabilité des systèmes algorithmiques ; de la régulation de la collecte, de l'usage et du traitement de données personnelles ; du renforcement de la régulation au travers de procédures numériques appropriées.

La confidentialité par conception est une forme de régulation qui inclut la protection des données personnelles dans toutes les étapes de la collecte et du traitement. Le traçage des outils appliqués aux données doit également être développé de manière à faciliter l'explication du modèle pour les experts comme pour les utilisateurs rendant les systèmes algorithmiques auditables. Les principes de confidentialité, bien que faciles à formuler, nécessitent de modifier les infrastructures de stockage et de traitement, avec d'importants impacts législatifs, sociologiques et économiques. Les techniques de transparence des systèmes algorithmiques seront développés en focalisant sur : l'équité, la loyauté et la non-discrimination et la redevabilité-par-construction.

Challenges :

  • Responsabilité-by-design, Explicabilité-by-design
  • Transparence-by-design, équité-by-design
  • Audit des systèmes algorithmiques : non-discrimination , loyauté, biais techniques, neutralité, équité
  • Mesure de la confiance et de l’appropriation du numérique
  • « Progressive user-centric-analytics » (monitoring interactif des systèmes de décisions : dataviz dashboards, IHM) 
  • Responsabilité du traitement de l’information et de la prise de décision : contrôle d’usage des données et fact-checking
  • Découverte causale, traçabilité des inférences à partir des données sources, interprétabilité des architectures profondes
Ancre
PROTECTION, RÉGULATION ET ÉCONOMIE DE LA DONNÉE
Corps de texte

Les entreprises impliquées dans l'économie de la donnée ont continuellement besoin de repenser leur structuration : elles doivent adopter une organisation orientée-projet avec des changements rapides dans l'allocation de ressources. L'économie de la donnée soulève aussi des problèmes de concentration et de monopole.

Un petit nombre d'entreprises (GAFAM) détiennent la plupart des données. Cette concentration de marché peut conduire à une compétition déloyale dont l'innovation dans les petites et moyennes entreprises risque de pâtir. Les citoyens attendent des gouvernements qu'ils interviennent dans l'économie digitale pour éviter trop de concentration et de monopole. Les gouvernements doivent empêcher la fuite des informations pour préserver la souveraineté des états et le respect des régulations.   

Challenges :

  • « Privacy-by-design », GDPR
  • Apprentissage respectueux de la vie privée( « differential privacy »)
  • Développement de méthodologies éthiquement responsables, et de technologies pour réguler la collection, l’usage et le traitement des données personnelles, et l’exploitation des connaissances tirées de ces données
  • Sécurité informatique des chaînes de traitement de données
  • Sécurité/crypto : block-chain et tiers de confiance