Le projet « StreamOps »

La communauté scientifique développe des algorithmes pour gérer des flux de données. Les industriels, eux, cherchent à analyser le sujet d’une manière plus applicative. 

 

Karine Zeitouni, Yehia Taher (Laboratoire DAVID, Université Versailles Saint-Quentin-en-Yvelines) et Cédric Gouy-Pailler (Laboratoire d’Analyse de Données et Intelligence des Systèmes, CEA List) ont décidé d’unir leurs compétences pour proposer à la communauté scientifique un nouvel outil simple pour développer des algorithmes puissants capables de gérer les problèmes de flux de données. Cet outil s’appliquera notamment dans le domaine médical en collaboration avec Philippe Aegerter (Inserm UMR 1168) et Marc Fischler (Hôpital Foch, Université Versailles Saint-Quentin-en-Yvelines).

Une plateforme de streaming générique mais à la pointe

En informatique, des outils extrêmement puissants en termes de débit de données et de robustesse sont développés. « Avec le projet StreamOps, nous voulons nous positionner à l’interface des aspects algorithmiques, métiers et logiciels pour proposer à l’ensemble des acteurs une plateforme de streaming générique mais à la pointe au niveau des algorithmes », nous explique Cédric. En effet, l’ambition de StreamOps est de répondre simultanément aux objectifs suivants :

  • Performances en détection (réactivité, précision), performance en compression d’information, prise en compte de la confidentialité des données ;

  • Prise en considération des problèmes liés aux données réelles (données manquantes, problèmes capteurs) ;

  • Facilité d’intégration de nouveaux algorithmes ;

  • Robustesse opérationnelle (débit de données important, robustesse aux pannes de nœuds).

Des flux de données issues de capteurs environnementaux et de capteurs de santé

Karine travaille avec Yehia depuis quelques années sur le projet Polluscope (ANR) et avec Philippe dans le cadre de ACE-ICSEN, projet IRS de l’Université Paris-Saclay. Ils ont rencontré Cédric au sein du Center for Data Science et ont décidé de soulever ensemble cette question de gestion de données, d’analyse de données et de Machine Learning sur les données issues de l’IoT.

D’une part, StreamOps va se baser sur un échantillon des données de Polluscope récupérées par des boitiers multi-capteurs portatifs dans le cadre d’une collecte participative. L’objectif de Polluscope est d’analyser, dans toutes les dimensions, l’ensemble des informations de pollution pour caractériser l’exposition d’un individu à la pollution de l’air. Le projet SteamOps contribuera à faire de l’analyse et du Machine Learning sur ces flux de données. D’autre part, un capteur multi-signaux physiologiques (patch) connecté est en parallèle sur le point d’être testé par Philippe et Marc sur le suivi médical en pré-opératoire et surtout post-opératoire. L’idée est de coller sur le thorax du patient opéré un patch multi-capteurs pour le suivre à distance et en permanence pendant les jours qui suivent l'intervention, afin d'anticiper les risques de complications et de déclencher l'alerte à bon escient grâce à un système d'aide à la décision intelligent, sans devoir bloquer le patient dans une unité médicale spécialisée. L’objectif dans StreamOps est de partir de ces deux types de données pour ensuite créer une application générique.

Se positionner à l'interface

Karine précise : « Nous allons développer de nouveaux algorithmes qui feront l’interface entre une communauté qui voit les données comme des séries temporelles et qui les analyse d’un point de vue historique, et une autre qui voit l’IoT comme un flux de données et analyse l’ensemble de ces données de manière dynamique, au fur et à mesure de leur enregistrement. » L’objectif de StreamOps est de développer des méthodes et des algorithmes pour considérer l’ordre temporel dans les flux de données. Cédric travaille régulièrement avec des industriels également intéressés par la possibilité d’avoir des outils automatiques pour traiter les données qui viennent en flux. « Il ne s’agit pas de proposer une plate-forme de plus, explique Karine, mais une plate-forme intégratrice. » L’équipe StreamOps compte notamment collaborer avec Albert Bifet, Telecom ParisTech, qui a développé la plate-forme MOA (Massive Online Analysis) afin de créer une plateforme compatible et arriver à établir des synergies.


Contacts : Karine Zeitouni | Cédric Gouy-Pailler | Yehia Taher