Menu
- Présentation
- Equipes de recherche
- Production
- Logiciels et bases de données
- Animations scientifiques
- Enseignement
- Stages
- Pôles techniques
- Sécurité
- Liens
- PRABI
- Projets en cours
Rechercher

UMR CNRS 5558 - LBBE "Biométrie et Biologie Évolutive" UCB Lyon 1 - Bât. Grégor Mendel 43 bd du 11 novembre 1918 69622 VILLEURBANNE cedex
Ma thématique de recherche consiste en l’étude de la structure et de l’évolution des génomes procaryotes (bactéries et archées). Plus précisément, je me suis orienté depuis 1999 vers la détection et l’analyse des transferts horizontaux de gènes chez ces organismes. Afin de pouvoir étudier ces phénomènes, j’ai effectué un certain nombre de développements informatiques. Ces développements ont consisté en la construction de bases de données et en la mise en place de logiciels et de méthodes statistiques dont la portée dépasse le cadre de cette seule problématique. En effet, ces outils – par le biais de collaborations avec de nombreux groupes, aussi bien français qu’étrangers – ont permis d’obtenir des résultats dans des domaines aussi divers que l’identification d’espèces bactériennes, la prédiction de la localisation subcellulaire des protéines ou l’étude de données d’expression de cancers.
Les résultats biologiques les plus marquants que j’ai obtenus au cours de ces deux dernières années sont tous relatifs aux transferts de gènes observés dans différents groupes taxonomiques bactériens :
Les bactéries hyperthermophiles.
Les bactéries fixatrices d’azote atmosphérique.
Une bactérie pathogène des plantes : Ralstonia solanacearum.
Dans tous les cas, l’approche choisie pour étudier ces transferts était celle de la phylogénie moléculaire. Cette approche a été préférée à celle, plus communément utilisée, des mesures intrinsèques d’usage du code ou des oligonucléotides. Une des conséquences de l’utilisation d’une approche phylogénétique a été la nécessité de disposer de moyens de calculs importants, d’ou le recours systématique à l’utilisation de la ferme du Centre de Calcul de l’IN2P3 (CC-IN2P3) à Lyon, ferme comprenant plusieurs milliers de processeurs.
- +Développements méthodologiques -Développements méthodologiques
Depuis mon entrée au CNRS en 1992, les développements informatiques ont constitué une part importante de mon travail, part indispensable à la réalisation des recherches plus « biologiques » que j’ai eu à conduire et à diriger. Cette section se propose donc de décrire rapidement les développements récents que j’ai effectués.
Banques de familles de gènes
La génomique comparative constitue l’une des principales voies de l’analyse des séquences, ceci étant d’ailleurs une des conséquences directes de la disponibilité d’un nombre croissant de génomes complets. Ainsi, la phylogénie moléculaire constitue l’une des branches les plus importantes de cette approche. Le problème de la recherche des homologues – étape obligatoire de toute étude de génomique comparative – est qu’il s’agit d’un processus complexe qui requiert d’effectuer une série de traitements chaînés. Ainsi, il est nécessaire de récupérer les séquences dans les collections généralistes, de déterminer des similarités entre ces séquences, de les regrouper en familles, puis de calculer des alignements multiples et éventuellement des arbres phylogénétiques.
Afin de faciliter les analyses de génomique comparative dans lesquelles j’étais impliqué, j’ai participé au développement de plusieurs banques de données de gènes homologues. La première d’entre elles fut HOBACGEN (Homologous Bacterial Genes Database), dédiée aux gènes protéiques de bactéries, d’archées et de levure. Devant le succès remporté par ce système, Laurent Duret (Directeur de Recherche CNRS au Laboratoire de Biométrie et Biologie Évolutive) et moi-même avons alors décidé de mettre en place HOGENOM (Homologous Sequences in Complete Genomes), dédiée à l’ensemble des génomes complètement séquencés. Du fait de la forte redondance qui existait entre le contenu d’HOBACGEN et d’HOGENOM, celle-ci a remplacé la première.
Un problème récurrent pour toute banque de données est celui de la mise à jour. Les systèmes précédents ne font pas exception, et la procédure mise en place requiert d’utiliser les ressources en calcul parallèle du CC-IN2P3. En effet, la construction de ces banques nécessite de rechercher des similarités entre un grand nombre de séquences, puis de calculer des milliers d’alignements multiples et d’arbres phylogénétiques. Or, du fait que : i) le temps de doublement du nombre de séquences disponibles est de l’ordre de 16,5 mois ; et ii) la procédure de mise à jour nécessite de reconstruire complètement les familles, la stratégie actuellement utilisée n’est pas tenable sur le long terme. Pour pallier ces problèmes nous avons développé MultiHoSeqI (Multiple Homologous Sequence Identification) une méthode incrémentale permettant d’ajouter facilement un grand nombre de séquences dans nos banques de données.
Services au PRABI
Le Pôle Rhône-Alpes de Bioinformatique (PRABI) est une plate-forme labellisée RIO (Réseau Inter-Organismes) qui regroupe plusieurs équipes travaillant dans le domaine de la bioinformatique dans la région Rhône-Alpes. Le portail du PRABI donne accès à de nombreux services (recherche de similarités, accés aux banques de données, biologie structurale, etc.) , et je contribue toujours au développement d’un certain nombre d’entre eux.
Parmi les services que j’ai contribué à mettre en place puis à développer, figurent en particulier tout ce qui concerne la consultation des banques de données séquences. Le développement significatif le plus récent auquel j’ai participé est l’introduction du service HoSeqI (Homologous Sequences Identification), pour l’identification de séquences homologues dans les banques de familles de gènes. Ce système automatise toute la chaîne de traitement depuis la recherche de similarité d’une séquence dans une banque jusqu’au calcul d’un arbre permettant d’identifier visuellement l’espèce la plus proche de celle correspondant à la séquence soumise.
Analyse des données de puces à ADN
En collaboration avec le groupe de Desmond Higgins, du Conway Institute de l’Université de Dublin, j’ai participé au développement d’une bibliothèque R dédiée à l’analyse des données d’expression mesurées à l’aide de puces à ADN. Cette bibliothèque – de nom MADE4 – permet d’utiliser facilement sur de telles données deux méthodes habituellement employées dans le domaine de l’écologie : une méthode de classification supervisée, l’Analyse Inter/Intra (AII) ; et une méthode multi-tableaux, l’Analyse de Co-Inertie (ACI). Cette bibliothèque a été validée par le consortium Bioconductor, et elle est maintenant distribuée par l’intermédiaire de cette organisation.
En collaboration avec Florent Baty, du groupe Pulmonary Gene Research de l’Hôpital de l’Université de Bâle, j’ai également proposé une amélioration significative de l’AII consistant en l’introduction d’une procédure de rééchantillonnage permettant de sélectionner un ensemble de gènes discriminants.
+Publications -Publications
article :
Monteil CL, Perrière G, Menguy N, Ginet N, Alonso B, Waisbord N, Cruveiller S, Pignol D, Lefèvre CT (2018)
Genomic study of a novel magnetotactic Alphaproteobacteria uncovers the multiple ancestry of magnetotaxis, Environmental microbiology, vol. 20 pp.4415-4430.
Philippon H, Souvane A, Brochier-Armanet C, Perriere G (2017)
IsoSel: Protein Isoform Selector for phylogenetic reconstructions, PLoS One, vol. 12 pp.e0174250-e0174250.
Fischer MJ, Rustenhloz C, Leh-Louis V, Perriere G (2015)
Molecular and functional evolution of the fungal diterpene synthase genes, BMC microbiology, vol. 15 pp.221-221.
Flandrois JP, Perrière G, Gouy M (2015)
leBIBIQBPP: a set of databases and a webtool for automatic phylogenetic analysis of prokaryotic sequences, BMC Bioinformatics, vol. 16 pp.251-251.
Philippon H, Brochier-Armanet C, Perriere G (2015)
Evolutionary history of phosphatidylinositol- 3-kinases: ancestral origin in eukaryotes and complex duplication patterns, BMC evolutionary biology, vol. 15 pp.226-226.
Bigot T, Daubin V, Lassalle F, Perrière G (2013)
TPMS: a set of utilities for querying collections of gene trees, BMC Bioinformatics, vol. 14 pp.109-109.
Perrière G (2013)
Génomes protéomes et transcriptomes à foison, Pour la science, vol. 433 pp.38-39.
Perrière G (2012)
ReNaBi-IFB : The French Bioinformatics Infrastructure, EMBNet.journal, vol. 18 pp.12-13.
Picard F, Perrière G (2011)
Bioinformatics developments for NGS data analysis at PRABI, EMBnet.journal, vol. 17 pp.12-12.
Arigon A M, Perrière G, Gouy M (2010)
Proposals for classification methods dedicated to biological data, International Journal of Biomedical Engineering and Technology, vol. 3(1) pp.4-21.
Penel S, Arigon A-M, Dufayard J-F, Sertier A-S, Daubin V, Duret L, Gouy M, Perrière G (2009)
Databases of homologous gene families for comparative genomics, BMC Bioinformatics, vol. 10 pp.s3-s3.
Arigon A-M, Perrière G, Gouy M (2008)
Automatic identification of large collections of protein-coding or rRNA sequences, Biochimie, vol. 90 pp.609-614.
Perrière G (2008)
Bioinformatics in the complete genome sequence era, Biochimie, vol. 90 pp.553-554.
Fall S, Mercier A, Bertolla F, Calteau A, Guéguen L, Perrière G, Vogel TM , Simonet P (2007)
Horizontal Gene Transfer Regulation in Bacteria as a "Spandrel" of DNA Repair Mechanisms, PLoS One, vol. 2 pp.e1055-e1055.
Jeffery IB, Madden SF, McGettigan PA, Perrière G, Culhane AC, Higgins DG (2007)
Integrating transcription factor binding site information with gene expression datasets, Bioinformatics, vol. 23 pp.298-305.
Arigon A-M, Perrière G, Gouy M (2006)
HoSeql : automated homologous sequence identification in gene family databases, Bioinformatics, vol. 22 pp.1786-1787.
De Laplanche E, Gouget K, Cleris G, Dragounoff F, Demont J, Morales A, Bezin L, Godinot C, Perrière G, Mouchiroud D, Simonnet H (2006)
Physiological oxygenation status is required for fully differentiated phenotype in kidney cortex proximal tubules, American Journal of Physiology - Renal Physiology, vol. 291 pp.F750-F760.
Grassot J, Gouy M, Perrière G, Mouchiroud G (2006)
Origin and Molecular Evolution of Receptor Tyrosine Kinases with Immunoglobulin-Like Domains., Molecular Biology and Evolution, vol. 23 pp.1232-1241.
Baty F, Bihl MP, Perrière G, Culhane AC, Brutsche MH (2005)
Optimized between-group classification: a new jackknife-based gene selection procedure for genome-wide expression data, BMC Bioinformatics, vol. 6 pp.239-239.
Calteau A, Gouy M, Perrière G (2005)
Horizontal transfer of two operons coding for hydrogenases between bacteria and archaea, Journal of Molecular Evolution, vol. 60 pp.557-565.
Charif D, Thioulouse J, Lobry JR, Perrière G (2005)
Online synonymous codon usage analyses with the ade4 and seqinR packages, Bioinformatics, vol. 21 pp.545-547.
Culhane AC, Thioulouse J, Perrière G, Higgins DG (2005)
MADE4: an R package for multivariate analysis of gene expression data, Bioinformatics, vol. 21 pp.2789-2790.
Dufayard JF, Duret L, Penel S, Gouy M, Rechenmann F, Perrière G (2005)
Tree pattern matching in phylogenetic trees: automatic search for orthologs or paralogs in homologous gene sequence databases, Bioinformatics, vol. 21 pp.2596-2603.
Ginolhac A, Jarrin C, Robe P, Perrière G, Vogel TM, Simonet P, Nalin R (2005)
Type I polyketide synthases may have evolved through horizontal gene transfer, Journal of Molecular Evolution, vol. 60 pp.716-725.
Ginolhac A, Jarrin C, Gillet B, Robe P, Pujic P, Tuphile K, Bertrand H, Vogel TM, Perrière G, Simonet P, Nalin R (2004)
Phylogenetic analysis of polyketide synthase I domains from soil metagenomic libraries allows selection of promising clones., Applied and Environmental Microbiology, vol. 70 pp.5522-5527.
Ruau D, Duarte J, Ourjdal T, Perrière G, Laudet V, Robinson-Rechavi M (2004)
Update of NUREBASE: nuclear hormone receptor functional genomics, Nucleic Acids Research, vol. 32 pp.D165-D167.
Wuyts J, Perrière G, Van De Peer Y (2004)
The European ribosomal RNA database, Nucleic Acids Research, vol. 32 pp.D101-D103.
Culhane AC, Perrière G, Higgins DG (2003)
Cross-platform comparison and visualisation of gene expression data using co-inertia analysis, BMC Bioinformatics, vol. 4 pp.1-15.
Daubin V, Lerat E, Perrière G (2003)
The source of laterally transferred genes in bacterial genomes, Genome Biology, vol. 4 pp.R57.1-R57.12.
Daubin V, Perrière G (2003)
G+C3 structuring along the genome: a common feature in prokaryotes, Molecular Biology and Evolution, vol. 20 pp.471-483.
Devulder G, Perrière G, Baty F, Flandrois J-P (2003)
BIBI a bioinformatics bacterial identification tool, Journal Clinical Microbiology, vol. 41 pp.1785-1787.
Grassot J, Mouchiroud G, Perrière G (2003)
RTKdb: database of Receptor Tyrosine Kinase, Nucleic Acids Research, vol. 31 pp.353-358.
Perrière G, Combet C, Penel S, Blanchet C, Thioulouse J, Geourjon C, Grassot J, Charavay C, Gouy M, Duret L, Deléage G (2003)
Integrated databanks access and sequence/structure analysis services at the PBIL., Nucleic Acids Research, vol. 31 pp.3393-3399.
Perrière G, Thioulouse J (2003)
Use of Correspondence Discriminant Analysis to predict the subcellular location of bacterial proteins, Computer Methods and Programs in Biomedicine, vol. 70 pp.99-105.
Culhane AC, Perrière G, Considine E C, Cotter TG, Higgins D G (2002)
Between-group analysis of microarray data, Bioinformatics, vol. 18 pp.1600-1608.
Daubin V, Gouy M, Perrière G (2002)
A phylogenomic approach to bacterial phylogeny: evidence of a core of genes sharing a common history, Genome Research, vol. 12 pp.1080-1090.
Duarte J, Perrière G, Laudet V, Robinson-Rechavi M (2002)
NUREBASE: database of nuclear hormone receptors, Nucleic Acids Research, vol. 30 pp.364-368.
Mougel C, Thioulouse J, Perrière G, Nesme X (2002)
A mathematical method for determining genome divergence and species delineation using AFLP, International Journal of Systematic and Evolutionary Microbiology, vol. 52 pp.573-586.
Perrière G, Thioulouse J (2002)
Use and misuse of correspondence analysis in codon usage studies, Nucleic Acids Research, vol. 30 pp.4548-4555.
Guindon S, Perrière G (2001)
Intragenomic base content variation is a potential source of biases when searching for horizontally transferred genes, Molecular Biology and Evolution, vol. 18 pp.1838-1840.
Lavire C, Louis D, Perrière G, Briolay J, Normand P, Cournoyer B (2001)
Analysis of pFQ31 a 8551-bp cryptic plasmid from the symbiotic nitrogen-fixing actinomycete Frankia, FEMS Microbiology Letters, vol. 197 pp.111-116.
Perrière G, Bessieres P, Labedan B (2000)
EMGLib: the enhanced microbial genomes library (update 2000), Nucleic Acids Research, vol. 28 pp.68-71.
Perrière G, Bessieres P, Labedan B (2000)
The Enhanced Microbial Genomes Library, Nucleic Acids Research, vol. 27 pp.63-65.
Perrière G, Duret L, Gouy M (2000)
HOBACGEN: database system for comparative genomics in bacteria, Genome Research, vol. 10 pp.379-385.
Goncalves I, Robinson M, Perrière G, Mouchiroud D (1999)
JaDis: computing distances between nucleic acid sequences, Bioinformatics, vol. 15 pp.424-425.
Perrière G, Gouy M, Gojobori T (1998)
The non-redundant Bacillus subtilis (NRSub) database: update 1998, Nucleic Acids Research, vol. 26 pp.60-62.
Perrière G, Moszer I, Gojobori T (1997)
The NRSub database: update 1997, Nucleic Acids Research, vol. 25 pp.53-56.
Duret L, Gasteiger E, Perrière G (1996)
LALNVIEW: a graphical viewer for pairwise sequence alignments, Computer Applications in the Biosciences, vol. 12 pp.507-510.
Perrière G, Gouy M (1996)
WWW-query: an on-line retrieval system for biological sequence banks, Biochimie, vol. 78 pp.364-369.
Perrière G, Lobry JR, Thioulouse J (1996)
Correspondence discriminant analysis: a multivariate method for comparing classes of protein and nucleic acid sequences, Computer Applications in the Biosciences, vol. 12 pp.519-524.
Perrière G, Moszer I, Gojobori T (1996)
NRSub: a non-redundant database for Bacillus subtilis, Nucleic Acids Research, vol. 24 pp.41-45.
Perrière G, Thioulouse J (1996)
On-line tools for sequence retrieval and multivariate statistics in molecular biology, Computer Applications in the Biosciences, vol. 12 pp.63-69.
Perrière G, Gouy M, Gojobori T (1994)
NRSub: a non-redundant data base for the Bacillus subtilis genome, Nucleic Acids Research, vol. 22 pp.5525-5529.
Perrière G, Dorkeld F, Rechenmann F, Gautier C (1993)
Object-oriented knowledge bases for the analysis of prokaryotic and eukaryotic genomes, In Proceedings of the 1st International Conference on Intelligent Systems for Molecular Biology, vol. 1 pp.319-327.
Perrière G, Gautier C (1993)
ColiGene: object-centered representation for the study of E coli gene expressivity by sequence analysis, Biochimie, vol. 75 pp.415-422.
Schmeltzer O, Medigue C, Uvietta P, Rechenmann F, Dorkeld F, Perrière G, Gautier C (1993)
Building large knowledge bases in molecular biology, In Proceedings of the First International Conference on Intelligent Systems for Molecular Biology, vol. 1 pp.345-353.
Cortay JC, Negre D, Galinier A, Duclos B, Perrière G, Cozzone AJ (1991)
Regulation of the acetate operon in Escherichia coli: purification and functional characterization of the IclR repressor, EMBO Journal, vol. 10 pp.675-679.
Galinier A, Bleicher F, Negre D, Perrière G, Duclos B, Cozzone A J, Cortay J C (1991)
Primary structure of the intergenic region between aceK and iclR in the Escherichia coli chromosome, Gene, vol. 97 pp.149-150.
book :
![]() | Perrière G, Brochier-Armanet C (2010) Concepts et méthodes en phylogénie moléculaire, Springer, 2010 |
inbook :
Duret L, Perrière G, Gouy M (1999)
HOVERGEN: comparative analysis of homologous vertebrate genes
in: Bioinformatics: databases and systems, Kluwer Academic Publishers, pp.21-35.
inproceedings :
Campan-Fournier A, Oger C, Ginevra C, Navratil V, Ranc AG, Perrière G, Jarraud S (2015)
Analyse de 32 souches de Legionella pneumophila de sévérités variables afin d`identifier les déterminants de la pathogénicité, JOBIM, pp.89-89.
Bigot T, Daubin V, Perrière G (2011)
Tpms: a Tree Pattern-matching Utility for Querying Gene Trees Collections, Journées Ouvertes Biologie Informatique Mathématiques (JOBIM), pp.111-112.
phdthesis :
Perriere G (2000)
HDR - Bases de données et outils d’analyse pour la génomique bactérienne .