Groupe de Travail en Génomique Comparative





Troisième réunion : GTGC, à Marseille, le 9 juillet 2007 (satellite de JOBIM 2007)

Réunion GTGC d'une demi-journée sur le thème "Reconstruction de génomes ancestraux".


Description - Inscriptions
Information sur le lieu de la réunion
Programme
Plus d'informations sur le groupe

Description

Un des premiers buts de la génomique comparative est l'étude de l'évolution moléculaire. Comparer les génomes à grande échelle (celle des chromosomes) permet de prendre pied sur le terrain de l'évolution des caryotypes, jusque-là étudiée par les seuls biologistes cellulaires. Mais en même temps que la forme des données, la façon de les analyser a aussi changé: les méthodes automatiques (les algorithmes) ont pris la place dans l'analyse génomique de l'expertise cytogénétique. Dans le cas de la reconstruction des génomes ancestraux des mammifères placentaires, ils ont parfois donné des résultats surprenants. En regroupant des biologistes cellulaires, moléculaires, bioinformaticiens et algorithmiciens, cette demi-journée satellite a pour but de comprendre la place du type de donnée, du type de traitement et des algorithmes dans les résultats obtenus.

Le nombre de places étant limité à 50, l'inscription est obligatoire mais gratuite. ATTENTION cette inscription est indépendante de celle de JOBIM. Pour l'organisation pratique et étant donné le peu de transport en commun en direction de Luminy à cette période, nous ferons attention à ce que les horaires de la réunion coïncident avec les horaires des bus et nous vous conseillons de choisir un hôtel au centre ville plutôt que sur le campus de Luminy, du moins si vous voulez vous déplacer passé 20h. Une liste d'hôtels est proposée sur le site de JOBIM.


Lieu de la réunion

Cette réunion se tiendra le lundi 9 juillet après-midi à Marseille, juste avant la conférence nationale de bioinformatique JOBIM et dans les mêmes locaux (Ecole de management Euromed, campus de Luminy). La salle est la numéro A406 de l'Ecole Euromed.

Vous trouverez sur le site de Jobim 2007 toutes les informations sur la localisation et l'accès à Euromed.

Programme

Thème général : "Reconstruction de génomes ancestraux"

Lundi 9 juillet
14h00 - 14h15 Mot d'accueil
14h15 - 15h00 Géraldine Jean De la reconstruction d'un génome médian au calcul de scénarii évolutifs corrects
15h00 - 15h15 PAUSE
15h15 - 16h00 Florence Richard Construction du caryotype de l'ancêtre des mammifères placentaires
16h00 - 16h30 PAUSE
16h30 - 17h15 Nadia El-Mabrouk Évolution de familles de gènes et inférence d'ordres ancestraux pour les gènes dupliqués en tandem
17h15 - 17h30 PAUSE
17h30 - 18h15 Hugues Roest-Crollius Reconstruction de 10 génomes ancestraux de vertébrés par une nouvelle méthode de "clustering by synteny"


Résumés des interventions


De la reconstruction d'un génome médian au calcul de scénarii évolutifs corrects

Géraldine Jean
Laboratoire Bordelais de Recherche en Informatique, Bordeaux

L'étude de l'évolution génomique par comparaison des génomes contemporains est freinée par le fait qu'il est impossible de connaître avec certitude l'architecture des génomes ancestraux. L'émission d'hypothèses sur ces génomes ancestraux est un problème combinatoire dont les résultats permettent d'apporter plus d'informations à la fois sur l'histoire de ces génomes contemporains mais également sur les mécanismes généraux de leur formation. Les méthodes de reconstruction ancestrale nécessitent trois étapes : l'identification de marqueurs communs dans les génomes contemporains, la construction de cartes comparatives de ces génomes et enfin la réconciliation de ces cartes en utilisant un critère de parcimonie pour reconstruire les cartes ancestrales.
Une fois l'architecture d'un génome médian trouvée, un des éléments essentiels est de déterminer les scénarii évolutifs. Hannenhalli et Pevzner proposent un algorithme pour déterminer un scénario parcimonieux entre deux génomes multichromosomaux. Cet algorithme présente des erreurs et a été tour à tour corrigé par Tesler puis Ozery-Flato et Shamir. Malgré ces corrections, la création d'une classification des notions définies par les différents auteurs nous a permis de mettre en évidence d'autres erreurs. Nous présenterons un algorithme correct permettant de déterminer un scénario parcimonieux entre deux génomes.


Construction du caryotype de l'ancêtre des mammifères placentaires

Florence Richard
Muséum d'Histoire Naturelle de Paris

La comparaison des caryotypes d'espèces de mammifères placentaires d'ordres divers a été initiée il y a plus de 20 ans en utilisant les techniques de cytogénétique classique. Pour une espèce donnée, les chromosomes présentent des profils en bandes reproductibles et caractéristique de cette espèce. La comparaison des caryotypes s'est avéré possible pour des espèces relativement proches ou présentant une vitesse d'évolution chromosomique faible. Dans ce cas, on détermine des homoéologies chromosomiques entre espèces (profil de bandes identiques). Depuis 10 ans, l'utilisation de la cytogénomique a permis des comparaisons plus poussées. Par exemple, l'utilisation de la Zoo-FISH permet des comparaisons entre espèces éloignées. On détermine alors des homologies chromosomiques (hybridation, par complémentarité des bases, des peintures chromosomiques d'une espèce A sur des segments chromosomiques d'une espèce B). En utilisant ces deux approches complémentaires, nous avons reconstitué le caryotype de l'ancêtre des mammifères placentaires en utilisant le principe de parcimonie : toute homologie chromosomique partagée par des espèces appartenant à des ordres différents sera considérée comme héritée d'un ancêtre commun. Ainsi, le caryotype de l'ancêtre des Mammifères placentaires aurait eu un caryotype constitué de 23 paires d'autosomes et une paire de chromosome sexuel XY.

Evolution de familles de gènes et inférence d'ordres ancestraux pour les gènes dupliqués en tandem

Nadia el-Mabrouk
Department of Computer Science and Operations Research, Université de Montréal, Canada

Etant donné une famille de gènes ayant des copies sur différents génomes, ainsi qu'un arbre pour cette famille obtenu par une méthode de reconstruction phylogénétique, comment peut-on inférer des relations d'orthologie et de paralogie entre les différentes copies? Cette distinction entre orthologues et paralogues est fondamentale pour l'annotation des gènes, étant donné que ce sont les gènes orthologues qui sont les plus suceptibles d'avoir la même fonction. La réponse a cette question est directement liée a l'histoire de duplication et de spéciation de la famille de gènes. Comment peut-on déduire une telle histoire à partir de l'arbre de gènes? Dans le cas d'un arbre d'espèces connu, la méthode classique permettant de situer les événements de duplication est la ''reconciliation''.

Notre exposé présentera deux problématiques relatives à l'évolution de familles de gènes, qui seront traitées par des approches algorithmiques. Le premier volet consiste à inférer, à partir d'un arbre de gènes, une histoire d'évolution par duplication, speciation et perte donnant lieu à un minimum de pertes. La méthode développée permet d'inférer les copies ancestrales dans chaque génome précédant un événement de spéciation.

Le deuxième volet traitera du cas particulier de duplications en tandem. Dans ce cas, l'inférence de l'histoire d'évolution de la famille de gènes nécessite de tenir compte, non seulement de la phylogénie, mais également de l'ordre des gènes dans les génomes actuels. Lorsqu'une telle ''phylogénie ordonnée'' ne peut pas être expliquée par une histoire de duplication en tandem, spéciation et pertes, des réarrangements génomiques sont susceptibles de s'être produits. Je présenterai une méthode algorithmique permettant de minimiser le nombre d'inversions nécessaire pour obtenir une histoire cohérente pour la famille de gènes. Cette méthode permet également d'inférer l'order des gènes dans les génomes ancestraux.


Reconstruction de 10 génomes ancestraux de vertébrés par une nouvelle méthode de "clustering by synteny"

Matthieu Muffato et Hugues Roest Crollius
Groupe Dyogen, CNRS UMR8541, Ecole Normale Supérieure, Paris.

Les méthodes de reconstruction de génomes ancestraux actuelles les plus précises s'appuient sur les séquences de génomes d'espèces contemporaines. Chez les vertébrés, dont il existe aujourd'hui plus de 25 génomes séquencés à divers degrés de finition, plusieurs essais de reconstruction d'ordre de gènes ou même de séquences nucléotidiques ont déjà eu lieu avec de bons résultats. En ce qui concerne les ordres de gènes ancestraux, ces méthodes s'appuient sur des algorithmes dont le but est de reconstruire un scénario retraçant les événements de réarrangements chromosomiques (inversions, translocations, fusions, fissions), pour aboutir à des états ancestraux.
Nous avons développé une nouvelle approche, plus générale, qui considère la présence de blocs de synténie comme des éléments indivisibles et évalue la chance qu'ils aient pu être sur un même chromosome ancestral sur la base de leur présence/absence sur les chromosomes d'espèces contemporaines. Un deuxième algorithme, conçu pour la clusterisation des grands graphes basé sur des marches aléatoires (Pons et al. IBISC 2006), est ensuite appliqué pour regrouper les blocs en chromosomes ancestraux. Finalement un ordre ancestral de gènes est estimé par la méthode du voyageur de commerce.
Nous avons simulé l'évolution d'un génome ancestral de vertébrés en 16 génomes contemporains selon la phylogénie des vertébrés, en introduisant des réarrangements le long de différentes lignées menant aux espèces dont le génome est réellement séquencé et tout en modulant leur fréquences selon les branches. Nous présenterons l'évaluation de la méthode dans le cadre de ce scénario évolutif simulé, ainsi que son application aux données réelles qui a mené à la reconstruction de 10 génomes de vertébrés ancestraux.


Plus d'informations sur le groupe GTGC ici, et abonnez-vous à la liste de diffusion du groupe : cliquez ici