Chez les eucaryotes, les processus de transcription et de maturation des ARN dans le noyau peuvent aboutir à l’expression de différents isoformes à partir d’un même gène, via l’utilisation de sites alternatifs d’épissage, de début de transcription, ou de polyadénylation. L’architecture des gènes (nombre et taille des introns) ainsi que le degré de complexité des transcrits isoformes varient fortement entre différents taxons. La raison d’être de cette diversité est encore mal comprise. Selon certains auteurs, cette complexité résulterait de pressions sélectives pour augmenter le répertoire fonctionnel des génomes. Mais selon d’autres, ces isoformes seraient majoritairement non-fonctionnels, et résulteraient de l’accumulation de mutations délétères par dérive génétique aléatoire, qui induiraient des erreurs des machineries cellulaires d’expression. L’objectif de mon travail est d’estimer dans quelle mesure la taille efficace des populations (Ne, qui définit l’intensité de la dérive génétique) influe sur l’évolution de la structure et de la complexité de l’expression des gènes chez les métazoaires. Ce projet repose sur l’analyse comparative de génome et de transcriptomes dans des dizaines de paires d’espèces présentant des Ne contrastées, au sein de cinq groupes taxonomiques. Mon travail nécessite des développements bioinformatiques importants pour assurer l’analyse et la gestion de gros volumes de données.