Catégorie
DATAIA Seminars

Séminaire DATAIA | Alba Martinez-Ruiz - "Numerical and Computing Strategies to Scale Algorithms for Statistical Learning"

Bandeau image
Séminaire DATAIA | Alba Martinez-Ruiz
Date de tri
Lieu de l'événement
CentraleSupélec, Amphi III (bât. Eiffel) - Gif-sur-Yvette

Partager

twlkml
Chapo
Dans le cadre de son animation scientifique, l'Institut DATAIA organise tout au long de l'année des séminaires visant à échanger autour de l'IA.
Contenu
Corps de texte

Titre

"Numerical and Computing Strategies to Scale Algorithms for Statistical Learning"

 

Résumé

À l'ère du big data et de l'intelligence artificielle, la gestion et l'analyse de grands ensembles de données sont devenues fondamentales dans plusieurs disciplines scientifiques. Le traitement simultané de grands blocs de données en continu est un problème coûteux sur le plan informatique. Les données en continu sont générées et collectées en permanence à partir de nombreuses sources différentes. Elles proviennent, par exemple, d'un grand nombre de machines automatiques dans un système de production, d'un ensemble de dispositifs médicaux ou d'appareils connectés à l'internet (internet des objets).

Plusieurs stratégies peuvent être suivies pour analyser ces données. Les stratégies numériques se réfèrent à des modifications ou des améliorations dans le calcul des algorithmes de manière à améliorer les temps d'exécution dans l'analyse de données volumineuses, tout en préservant des propriétés telles que la convergence et la monotonicité. À titre d'illustration, nous examinons une nouvelle procédure de calcul de la factorisation de la matrice de redondance multiblocs M, qui rend la méthode multiblocs plus rapide et plus efficace lors de l'analyse de grandes données en continu et de matrices denses à haute dimension. Les stratégies de calcul font référence au calcul parallèle ou à la parallélisation des algorithmes pour leur exécution sur des systèmes de calcul à haute performance (HPC).

L'objectif principal est de permettre aux algorithmes de traiter les données plus rapidement dans les systèmes distribués. Deux approches sont possibles : Master-Workers (MW) et Single Program Multiple Data (SPMD). Pour illustrer notre propos, nous présentons le processus de parallélisation de l'algorithme PLS Mode B, une méthode multi-blocs et un algorithme étroitement lié.
 

Biographie

Alba Martínez Ruiz est professeure invitée par Arthur Tenenhaus au laboratoire L2S de CentraleSupélec, France. Elle est ingénieur industriel et titulaire d'une maîtrise en ingénierie de la Pontificia Universidad Católica de Chile, Chili, et d'un doctorat en statistiques appliquées de l'Universitat Politècnica de Catalunya BarcelonaTech, Espagne. Elle est professeur à plein temps depuis 1999, d'abord à l'Universidad Católica de la Santísima Concepción, puis à l'Universidad Diego Portales au Chili. Elle est membre élu de l'ISI depuis 2021, présidente de l'IASC-LARS 2025-2026 et secrétaire scientifique de l'IASC-LARS 2017-2021. Ses recherches portent sur l'analyse de données multiblocs, les méthodes basées sur les composantes, la modélisation PLS, les méthodes statistiques de réduction de la dimensionnalité, l'analyse des big data, le changement climatique, l'analyse des données multi-omiques et le développement de nouveaux indicateurs pour mesurer la valeur technologique.

Ancre
Informations pratiques
Corps de texte
  • Le séminaire aura lieu le jeudi 27 mars 2025, de 12h30 à 14h à CentraleSupélec, Amphi III (bâtiment Eiffel) à Gif-sur-Yvette ;
  • Une pause sucrée sera servie à l'issue.
Corps de texte

Ne ratez pas l'annonce d'un nouveau séminaire DATAIA !
Inscrivez-vous à la liste de diffusion de nos séminaires en cliquant ici.