Le développement des approches de génomique comparative a permis de mettre en évidence la nature combinatoire de l’évolution modulaire des protéines. Cependant, si ces méthodes permettent de proposer des liens fonctionnels entre différentes protéines ou domaines protéiques, elles ignorent généralement la dimension phylogénétique qui permettrait d’élucider la nature des mécanismes évolutifs qui sous-tend leur évolution. Ce projet a pour objectif de reconstituer les scénarios d’évolution des protéines modulaires afin d’identifier les principes évolutifs à l’œuvre et leurs implications fonctionnelles. Dans un premier temps, les arrangements en domaines des protéines et les familles de gènes seront déduits respectivement des bases ProDom et HoGenom, développées au laboratoire de Biométrie et Biologie évolutive. L’utilisation d’un réseau Bayésien pour inférer les scénarios d’évolution tiendra compte de la phylogénie des espèces, et permettra de déduire le répertoire des arrangements en domaines des protéines des génomes ancestraux, sur la base d’un modèle probabiliste. Les scénarios ainsi calculés permettront non seulement de proposer une origine évolutive pour les différents arrangements en domaines, mais aussi de les mettre en relation et d’en déduire les filiations possibles.
On cherchera en particulier à associer l’apparition de nouveaux arrangements en domaines à l’émergence de grandes fonctions biologiques (photosynthèse, communication inter-cellulaire, développement, …). On vérifiera sur quelques exemples l’adéquation de ces scénarios avec d’autres connaissances du domaine, incluant l’analyse phylogénétique des séquences. Les contradictions éventuelles nous amèneront à développer, dans une deuxième phase, un modèle plus complexe d’évolution prenant en compte également les relations phylogénétiques entre séquences, et incluant explicitement la possibilité de transferts horizontaux.
Ce projet débouchera ainsi sur un modèle probabiliste de l’évolution des protéines modulaires qui prenne en compte à la fois la phylogénie des espèces, les relations de séquence et les transferts horizontaux. Ce modèle unifié généralisera les approches précédemment décrites de "pierre de Rosette" et de profils phylogénétiques, en y ajoutant une dimension essentielle : la phylogénie des espèces. Il nous permettra de comparer plus rigoureusement les scénarios d’évolution qu’avec les profils phylogénétiques conventionnels. Le modèle développé fournira ainsi un outil qui permettra non seulement de mieux comprendre les principes de l’évolution modulaire des protéines, mais également des réseaux d’interactions entre protéines et l’émergence de nouvelles fonctions dans les génomes.