Reconstruction de réseaux d’interactions microbiens

Principes, limites et applications aux aliments fermentés

September 13, 2023

Pourquoi utiliser des réseaux ?

Outil d’analyse exploratoire

  • Visualisation de données
  • Identification d’espèces systémiques et/ou clés de voûte (keystone species)
  • Identification de communautés

Quelques succès

Associer des taxa à un phénotype d’intérêt (Guidi et al. 2016)

  • Détection de modules
  • Associations module - phénotype

Construire une SynCom pour un phénotype (Poudel et al. 2023)

  • Taxas associés au phénotypes…
  • Et taxa associés aux précédents

Quelques succès

Prédire des changements de compositions grâce aux keystone species (Herren and McMahon 2018)

\(R^2\) entre abondance pondérée des espèces clés de voûte et changement de composition au sein de phytoplanctons lacustres

Comment les reconstruire ?

Grandes familles de méthodes

  • Modèles métabolomiques : Exposés d’A. Siegel et S. Labarthe sur les réseaux métaboliques

  • Modèles dynamiques : gLV (Lotka-Volterra généralisé) et CR (Consumer - Resources), nécessite des séries temporelles d’abondances

  • Modèles statistiques : réseaux de co-occurrence, de corrélations (partielles), nécessite des données d’abondances \(\mathbf{Y}\).

Adapté de la Fig. 1 de Picot et al. (2023)

Réseau de co-occurrence

Formellement

La quasi-totalité des méthodes actuelles sont basées sur les modèles graphiques gaussiens

Interaction \(\simeq\) Co-occurrence \(\simeq\) Corrélation (partielle)

Réseau \(G\) \(\simeq\) Matrice de corrélation (\(\Sigma\)) ou de précision (\(\Omega = \Sigma^{-1}\))

Réseau

Matrice \(\Sigma\) ou \(\Omega\)

Reconstruire le réseau revient à estimer un \(\mathbf{\Sigma}\) / \(\mathbf{\Omega}\) parcimonieux avec \(\mathbf{Y} \sim \mathcal{N}(\mathbf{XB}, \mathbf{\Sigma})\).

De nombreuses méthodes

Basées sur les mêmes principes:

  • Transformation des données d’abondances pour les rendre (pseudo)-gaussiennes
    • Via des fonctions numériques (\(\log\), \(\arcsin\), \(\text{clr}\), …)
    • Via plongement dans un espace latent gaussien (PLN, ZINB, …)

Aperçu non exhaustif

Méthode Modèle Approche Covar. \(\mathbf{X}\) Réference
SPIEC-EASI CLR Gaussien MB Non Kurtz et al. (2015)
gCoda CLR Gaussien glasso Non Fang et al. (2015)
SPRING Copule MB Non Yoon, Gaynanova, and Müller (2019)
MAGMA Copule + ZINB MB Oui Cougoul, Bailly, and Wit (2019)
PLNetwork Couche latente + PLN glasso Oui Chiquet, Mariadassou, and Robin (2021)
ZiLN Couche latente + ZILN MB Non Prost, Gazut, and Brüls (2021)
COZINE CLR Gaussien + Hurdle MB Oui Ha et al. (2020)
HARMONIES Copule - ZINB glasso Non Jiang et al. (2020)

Avec des résultats constrastés…

Mais dépendant des comparaisons…

  • Simulation semi-paramétriques
  • Absence de covariables
  • Abondances totales homogènes
  • \(n \in \{50, 100, 500, 1000\}\)
  • Simulation paramétriques
  • Présence de covariables
  • Abondances totales hétérogènes
  • \(n \in \{25, 50, 100\}\)

Et les aliments fermentés ?

Figure 1: Fromage AOP affinés français

Projet MetaPDOCheese

Objectif: Faire l’inventaire des flores microbiennes des 44 AOP fromagères affinées françaises

Plan expérimental

  • (Jusqu’à) 10 productions par AOP avec collecte de
  • 1 échantillon de lait
  • 3 échantillons de fromages (issus de ce lait)
    • prélèvement en croûte et en pâte
  • Séquençage 16S (fraction bactérienne) et ITS (fraction fongique) des échantillons

Données purement observationnelles

Limites et verrous

Verrous

  • Traitement des données d’abondances
    • données fortement non-gaussiennes
    • transformations \(\log\), variables latentes, quantification absolue, etc
  • Traitement des zéros
    • jusqu’à 97% de valeurs nulles dans les abondances
    • modèles zéro-inflatés, pour données censorées
  • Gestion des facteurs environnementaux
    • inclusion comme régresseurs
    • stratification des données
  • Passage à l’échelle
    • approches quadratiques (MB) / cubique (glasso)
    • combinées à une surcouche bootstrap
  • Validation in silico / in culturo
    • résultats incohérents entre comparatifs
    • pas de bon modèle génératif
    • conditions difficiles à reproduire
  • Non-robustesse des résultats
    • méthodes consensus
    • Champion et al. (2023) et Peschel et al. (2021)

Facteurs environnementaux

Interactions indirectes

induites par une corrélation entre environnement et abondances

Adapté de la Fig. 2 de Faust (2021)

Interactions contexte-spécifiques

modulées par la composition du milieu et la disponibilité en nutriments

Adapté de la figure 3 de Weiss et al. (2023)

Modèles dynamiques: la solution ?

C’est compliqué…

Les modèles types gLV fonctionnent a priori bien

Proportion de reconstructions correctes, adapté de la Fig. 2 de Picot et al. (2023)

mais pour des chemostats, pas des batchs (Momeni, Xie, and Shou 2017)

Fig. 4 de Picot et al. (2023)

À retenir

  • Réseaux utiles pour décrire les communautés.

  • Ont permis de

    • relier des microbes à des fonctions

    • suggérer des consortia.

  • Possibilité de décrire finement les interactions à l’aide de

    • des séries temporelles,

    • des perturbations

    • des communautés synthétiques

    • des modèles métaboliques

En pratique,

  • Données observationnelles sont

    • les plus fréquentes (de loin)

    • les pires

  • Méthodes de reconstruction

    • ont une philosophie commune

    • imparfaites et incohérentes

  • Modèles dynamiques intéressants

  • mais pas la panacée pour les aliments fermentés

Références

Champion, Camille, Raphaelle Momal, Emmanuelle Le Chatelier, Mahendra Mariadassou, and Magali Berland. 2023. “OneNet One Network to Rule Them All: Consensus Network Inference from Microbiome Data.” http://dx.doi.org/10.1101/2023.05.05.539529.
Chiquet, J., M. Mariadassou, and S. Robin. 2021. “The Poisson-Lognormal Model as a Versatile Framework for the Joint Analysis of Species Abundances.” Frontiers in Ecology and Evolution 9.
Cougoul, A., X. Bailly, and E. C. Wit. 2019. “MAGMA: Inference of Sparse Microbial Association Networks,” no. 538579. https://www.biorxiv.org/content/10.1101/538579v1.full.pdf.
Fang, H., C. Huang, H. Zhao, and M. Deng. 2015. “CCLasso: Correlation Inference for Compositional Data Through Lasso.” Bioinformatics 31: 3172–80.
Faust, Karoline. 2021. “Open Challenges for Microbial Network Construction and Analysis.” The ISME Journal 15 (11): 3111–18. https://doi.org/10.1038/s41396-021-01027-4.
Friedman, J., T. Hastie, and R. Tibshirani. 2008. “Sparse Inverse Covariance Estimation with the Graphical Lasso.” Biostatistics 9 (3): 432–41. https://doi.org/10.1093/biostatistics/kxm045.
Guidi, Lionel, Samuel Chaffron, Lucie Bittner, Damien Eveillard, Abdelhalim Larhlimi, Simon Roux, Youssef Darzi, et al. 2016. “Plankton Networks Driving Carbon Export in the Oligotrophic Ocean.” Nature 532 (7600): 465–70. https://doi.org/10.1038/nature16942.
Ha, M. J, J. Kim, J. Galloway-Pena, K. A. Do, and C. B. Peterson. 2020. “Compositional Zero-Inflated Network Estimation for Microbiome Data.” BMC Bioinformatics 21 (581).
Herren, Cristina M., and Katherine D. McMahon. 2018. “Keystone Taxa Predict Compositional Change in Microbial Communities.” Environmental Microbiology 20 (6): 2207–17. https://doi.org/10.1111/1462-2920.14257.
Jiang, S., G. Xiao, A. Y. Koh, Y. Chen, B. Yao, Q.Li, and X.Zhan. 2020. “HARMONIES: A Hybrid Approach for Microbiome Networks Inference via Exploiting Sparsity.” Front. Genet. 11 (445).
Kurtz, Z. D., C. L. Müller, E. R Miraldi, D. R. Littman M. J. Blaser, and R. A. Bonneau. 2015. “Sparse and Compositionally Robust Inference of Microbial Ecological Networks.” PLoS Computational Biology 11 (5).
Layeghifard, Mehdi, David M. Hwang, and David S. Guttman. 2017. “Disentangling Interactions in the Microbiome: A Network Perspective.” Trends in Microbiology 25 (3): 217–28. https://doi.org/10.1016/j.tim.2016.11.008.
Meinshausen, N., and P. Bühlmann. 2006. “High-Dimensional Graphs and Variable Selection with the Lasso.” The Annals of Statistics, 1436–62. https://doi.org/10.1214/009053606000000281.
Momeni, Babak, Li Xie, and Wenying Shou. 2017. “Lotka-Volterra Pairwise Modeling Fails to Capture Diverse Pairwise Microbial Interactions.” eLife 6 (March). https://doi.org/10.7554/elife.25051.
Peschel, S., C. L. Müller, E. Von Mutius, A. L. Boulesteix, and M. Depner. 2021. “NetCoMi: Network Construction and Comparison for Microbiome Data in r.” Brief Bioinformatics 22 (4).
Picot, Aurore, Shota Shibasaki, Oliver J Meacock, and Sara Mitri. 2023. “Microbial Interactions in Theory and Practice: When Are Measurements Compatible with Models?” Current Opinion in Microbiology 75 (October): 102354. https://doi.org/10.1016/j.mib.2023.102354.
Poudel, Ravin, Ari Jumpponen, Megan M. Kennelly, Cary Rivard, Lorena Gomez-Montano, and Karen A. Garrett. 2023. “Integration of Phenotypes in Microbiome Networks for Designing Synthetic Communities: A Study of Mycobiomes in the Grafted Tomato System.” Edited by Irina S. Druzhinina. Applied and Environmental Microbiology 89 (6). https://doi.org/10.1128/aem.01843-22.
Prost, V., S. Gazut, and T. Brüls. 2021. “A Zero Inflated Log-Normal Model for Inference of Sparse Microbial Association Networks.” PLOS Computational Biology 17 (6).
Weiss, Anna S., Lisa S. Niedermeier, Alexandra von Strempel, Anna G. Burrichter, Diana Ring, Chen Meng, Karin Kleigrewe, Chiara Lincetto, Johannes Hübner, and Bärbel Stecher. 2023. “Nutritional and Host Environments Determine Community Ecology and Keystone Species in a Synthetic Gut Bacterial Community.” Nature Communications 14 (1). https://doi.org/10.1038/s41467-023-40372-0.
Yoon, G., I. Gaynanova, and C. Müller. 2019. “Microbial Networks in SPRING - Semi-Parametric Rank-Based Correlation and Partial Correlation Estimation for Quantitative Microbiome Data.” Frontiers in Genetics 10: 516.


A work by Migale Bioinformatics Facility
Université Paris-Saclay, INRAE, MaIAGE, 78350, Jouy-en-Josas, France
Université Paris-Saclay, INRAE, BioinfOmics, MIGALE bioinformatics facility, 78350, Jouy-en-Josas, France