Les espèces « fantômes », c'est-à-dire celles qui sont inconnues ou éteintes, sont infiniment plus nombreuses que les espèces vivantes identifiées. La plupart des flux de gènes détectés sur un ensemble choisi d'espèces connues sont donc susceptibles de provenir d'espèces fantômes. Dans un article de PLoS Biology [1], Théo Tricou, Eric Tannier et Damien de Vienne, membre de l'équipe Le Cocon montrent que la prise en compte de cette information habituellement négligée peut changer radicalement les conclusions des études sur les flux de gènes.
Voici un résumé de leur étude écrit par Damien de Vienne :
"En première approximation, toutes les espèces sont éteintes". Cette boutade, attribuée au paléontologue américain David Raup, nous rappelle que les espèces vivantes ne représentent qu'une infime proportion de toutes celles qui ont existé. De plus, la majorité des espèces vivantes nous sont probablement inconnues. C'est donc à partir de l'observation et de l'analyse d'une minorité d'espèces que nous cherchons à comprendre les processus qui gouvernent l'évolution du vivant.
Mais la diversité disparue ou inconnue a laissé des traces dans le génome des espèces que nous étudions, via les flux « horizontaux » de gènes – ou transmission de matériel génétique entre espèces. Ainsi trouve-t-on des gènes néandertaliens dans des génomes d'Homo sapiens – à la suite de croisements interspécifiques –, ou encore des gènes de résistance aux antibiotiques qui sont communs à des souches ou espèces distinctes de bactéries pathogènes.
Pourtant l'analyse des flux de gènes telle qu'elle est pratiquée aujourd'hui ignore habituellement l'existence passée ou présente des espèces fantômes, alors que ces dernières sont potentiellement les principales pourvoyeuses de gènes transmis horizontalement. Par des approches de simulation et une réanalyse de données publiées ces dernières années, nous montrons qu'ignorer les espèces fantômes peut conduire à proposer des scénarios évolutifs totalement erronés. La raison en est assez simple : l'interprétation du signal laissé par un flux de gènes dans les génomes des espèces étudiées peut être radicalement différente selon que l'on considère ou pas que des espèces fantômes sont impliquées. Nous avons évalué l'impact de cet effet habituellement négligé à partir des données de trois études : l'une proposant un test statistique de détection des flux de gènes entre espèces proches ; une autre portant sur l'étude de l'histoire évolutive du complexe d'espèces Anopheles gambiae, des moustiques vecteurs du paludisme ; une dernière sur l'estimation de l'ordre d'acquisition de différents gènes bactériens ayant conduit à l'émergence de la cellule eucaryote (y compris les gènes à l'origine de la mitochondrie).
Nos résultats montrent non seulement que l'interprétation des tests de détection des transferts est généralement erronée car elle conduit à une mauvaise identification des espèces donneuses et receveuses (étendant nos résultats récents, [2]), mais aussi que des hypothèses importantes en biologie évolutive basées sur la détection de flux de gènes peuvent être remises en question. Ainsi, notre réanalyse du complexe gambiae ouvre la possibilité d'une histoire évolutive différente de celle admise jusqu'alors, qui pourrait redessiner l'histoire des croisements interspécifiques dans ce groupe taxonomique important en termes de santé humaine. De même, la méthode utilisée pour ordonner l'histoire des intégrations de gènes par la cellule proto-eucaryote révèle une faiblesse méthodologique majeure : appliquée en tenant compte de la présence possibles d'espèces fantômes, elle revient à jouer à pile ou face pour savoir si un événement de transfert a eu lieu avant ou après un autre. Cela change notre connaissances des premières étapes de l'émergence du domaine du vivant auquel les humains appartiennent : les eucaryotes.
Ces résultats nous conduisent à proposer de nouvelles façons d'étudier les flux de gènes en reconnaissant l'existence d'espèces fantômes et leur contribution aux génomes des espèces actuelles. Ils ouvrent aussi la voie à des études permettant, grâce à la détection des flux de gènes, d'identifier et d'étudier ces espèces fantômes.
Damien de Vienne
[1] Théo Tricou, Eric Tannier, Damien M de Vienne, Ghost lineages can invalidate or even reverse findings regarding gene flow, PLoS Biology, 2022, https://doi.org/10.1371/journal.pbio.3001776 [2] Théo Tricou, Eric Tannier, Damien M de Vienne, Ghost Lineages Highly Influence the Interpretation of Introgression Tests, Systematic Biology, Volume 71, Issue 5, September 2022, Pages 1147–1158, https://doi.org/10.1093/sysbio/syac011