Axe méthodologique
Objectifs
Les réunions de l’axe méthodologique sont des rencontres
informelles destinées à stimuler les échanges au sein du
laboratoire. N’hésitez pas à vous exprimer, ces réunions
sont à usage interne. Vous pouvez présenter, par exemple :
o Un article, une pré-publication, de vous même ou bien de
la littérarure, qui vous semble intéressant de discuter.
o Une méthode, un algorithme (classique ou nouveau sur le
marché), une idée, une approche.
o Un logiciel, un paquetage, un site web, qui offre des
services intéressants.
o Un jeu de données intéressant pour son caractère historique
ou parce qu’il est très utilisé pour les test comparatifs
de différentes méthodes.
o Etc…
Participer
Vous pouvez envoyer vos contributions (typiquement 15
diapositives au format PDF) à
xmethodo@biomserv.univ-lyon1.fr
Calendrier
Les réunions de l’axe méthodologique ont lieu, sauf indication contraire, dans la salle de formation
du PRABI de 12h à 14h le premier lundi de chaque mois les mois sans
’m’ et le premier mardi de chaque mois les mois avec ’m’.
Par exemple, le mois de février ne comporte pas le caractère ’m’, ce sera donc le premier lundi de févrirer ; le mois mars, quant à lui, comporte un caractère
’m’, ce sera donc le premier mardi de mars. En cas de jour férié, on décale du nombre de semaines nécessaire sans changer de jour. Cet algorithme pour le choix de la date a été choisi pour que les chercheurs-enseignants et les praticiens hospitaliers du laboratoire qui ont des contraintes hebdomadaires fortes ne soient pas systématiquement pénalisés.
Un rappel à J-15, J-8 et J-0 sera envoyé sur la liste de diffusion du laboratoire.
Calendrier
| 2008 | 2009 | 2010 |
lundi 7 janvier 2008
lundi 4 fevrier 2008
mardi 4 mars 2008
lundi 7 avril 2008
mardi 6 mai 2008
lundi 2 juin 2008
lundi 7 juillet 2008
mardi 2 septembre 2008
lundi 6 octobre 2008
mardi 4 novembre 2008
mardi 2 décembre 2008 | lundi 12 janvier 2009
lundi 2 février 2009
mardi 3 mars 2009
lundi 6 avril 2009
mardi 5 mai 2009
lundi 8 juin 2009
lundi 6 juillet 2009
mardi 1 septembre 2009
lundi 5 octobre 2009
mardi 3 novembre 2009
mardi 1 décembre 2009 | lundi 4 janvier 2010
lundi 1 février 2010
mardi 2 mars 2010
lundi 5 avril 2010
mardi 4 mai 2010
lundi 7 juin 2010
lundi 5 juillet 2010
mardi 7 septembre 2010
lundi 4 octobre 2010
mardi 2 novembre 2010
mardi 7 décembre 2010 |
Archives (ordre chronologique direct)
-
+Lundi 5 février 2007
-Lundi 5 février 2007
Sandrine Charles nous a présenté un travail (avec Didier Pont et Fabien Subtil) de modélisation de la dynamique d’une population de chabots dans le bassin versant du Bez (Drôme) [PDF].
Jean Lobry nous a présenté une série d’articles à propos du calcul des intervalles de confiance pour les proportions [PDF].
Eric Tannier nous a présenté les problèmes méthologiques rencontrés lors de la reconstitution de l’organisation du génome ancestral des mammifères [PDF].
-
+Mardi 6 mars 2007
-Mardi 6 mars 2007
Laurent Guéguen nous a présenté des problèmes méthologiques liés aux techniques de fragmentation de séquences [PDF].
Gabriel Marais nous a présenté
MareyMap, un paquetage R pour estimer les taux de recombinaison [PDF].
Sylvain Mousset nous a présenté le logiciel DnaSP utilisé pour étudier le polymorphisme des séquences nucléiques, ce qui est disponible dans R, et
ce qu’il conviendrait de développer [PDF].
-
+Lundi 2 avril 2007
-Lundi 2 avril 2007
Émilie Vautrin nous a présenté les résulats d’un article accepté dans Journal of Theoretical Biology sur la modélisation de la dynamique des multi-infections chez Wolbachia [PDF]
.
Jean Lobry nous a présenté quelques problèmes méthodologiques liés à l’utilisation d’indices bibliométriques sur la base bibliographique du laboratoire [PDF]
.
-
+Lundi 4 juin 2007
-Lundi 4 juin 2007
Pascal Roy nous a présenté les résultats d’un article sur les problèmes de puissance avec les données des puces [PDF]
Jean Lobry nous a présenté quelques rectificatifs et mises à jour (graphviz, Martyn Plummer, Base biblio du labo, fraude à l’examen de Pierre-Simon Laplace) [PDF]
Agathe Bajard nous a présenté le projet SimNDP (Simulation et niveau de preuve) [PDF]
-
+Mardi 4 septembre 2007
-Mardi 4 septembre 2007
Marie-Hélène Metzger
nous a présenté les difficutés méthologiques et la grande complexité de collecte des données pour l’estimation de l’évolution au cours du temps (1996-2005) de l’importance des infections post-opératoires à long terme dans le cas des prothèses de hanches.
[PDF].
Thibault Jombart nous a présenté son paquet logiciel R adegenet.
[PDF].
Ce paquet est déjà disponible, sauvegardé et archivé sur les cinq continents via le réseau de miroirs du CRAN.
Les données utilisées pour la démonstration sont disponibles
ici, le code source est disponible ici.
[pour la reproductibilité utiliser la version adegenet 1.0-1 sous R 2.5.1 disponibles sur les archives du CRAN
ici]
Nicolas Voirin
nous a présenté des problèmes méthodologiques en relation avec la prise en compte de la variabilité intra-populationnelle pour la modélisation de la transmission de la grippe nosocomiale.
[PDF].
-
+mardi 4 décembre 2007
-mardi 4 décembre 2007
Élise Billoir nous a présenté l’analyse de données écotoxicologiques par inférence bayésienne
[PDF].
Emmanuel Prestat nous a présenté l’utilisation de la commande Sweave() de R pour générer des documents LaTeX incorporant automatiquement des résultats d’analyses effectuées sous R.
[PDF].
Jean-Pierre Flandrois et
Sophie Mignard
nous ont présenté Amalphy. Quel est l’impact des données manquantes sur les reconstitutions phylogénétiques utilisées en taxinomie bactérienne avec les containtes édictées par la commission Stackebrandt ? Comparaison des approches classiques (bioNJ, phyML, …) avec les SDM (Super Distance Matrix) dans le cas de 125 souches type d’espèce de mycobactéries
[PDF].
-
+lundi 7 janvier 2008
-lundi 7 janvier 2008
Benjamin Ribba nous a présenté une analyse exploratoire de d’une séries de données chronologiques portant sur des indicateur sérologiques de 94 chats FIV+
[PDF].
Marie-Laure Delignette-Muller nous a présenté la paquetage R nlstool. Ce paquetage est disponible sur le CRAN, par exemple sur le miroir du laboratoire ici. Le paquetage nlstools propose un certain nombre d’outils pour le contrôle de qualité des régressions non-linéaires
[PDF].
Marie-Claude Bel-Venner
nous a présenté une modélisation du choix du partenaire par les mâles : peut-on prédire dans quelles conditions les mâles seront plus ou moins sélectifs pour leur choix ?
[PDF].
-
+lundi 4 février 2008
-lundi 4 février 2008
Il y avait une interrogation surprise (PDF) en début de séance. La question est simple : dans les six graphiques de type camembert en 3D il faut désigner le plus petit et le plus grand secteur. D’après un article de Margaret Rangecroft (PDF).
Ivanny Marchant
nous a présenté une méthode de construction de population virtuelle : il s’agit de simuler au mieux, sans gommer en particulier la variabilité inter-individuelle, les caractéristiques de la population française pour évaluer la réponse d’indicateurs utilisés en santé publique. Les performances de deux estimateurs du risque cardiovasculaire (Framingham, SCORE) ne sont pas les mêmes.
[PDF].
Thibaut Jombart
nous a présenté ses "vaccances" au premier R-hackathon dédié
aux méthodes phylogéniques dans R
(il y avait du beau monde ). Le paquet phylobase posera à terme les bases de l’analyse de données comparatives dans R via la définition de classes S4 (on peut déjà noter phylo4 pour les phylogénies, phylo4d pour phylogénies + données, multiPhylo4 pour les phylogénies multiples et multiPhylo4d les phylogénies multiples + données). Le paquet phylobase est en pleine phase de développement début 2008, on trouvera la dernière version validée sur R-forge ici.
Dans la console R, faire simplement install.packages("phylobase", repos = "http://r-forge.r-project.org"). Voir la présentation de Thibaut pour tous les avantages de cette plateforme de développement collaboratif
[PDF].
Jean Lobry
nous a donné la correction de l’interrogation surprise
[PDF].
Il s’agit en fait d’un plaidoyer contre l’utilisation de constructions inefficaces et inutiles (Bertin, 1968) de type "camembert" pour la représentation des fréquences des modalités de variables qualitatives en analyse exploratoire des données.
Christian Gautier pose le problème suivant. On considère un test de
conformité de moyenne, distibution normale, variance connue. On fait
un test bilatéral de $H_0 : \mu = \mu_0$ contre $H_1 : \mu \ne \mu_0$.
On travaille avec $\alpha = 0.05$ et donc une valeur critique à
$\pm 1.96$. Supposons que l’on ait rejetté $H_0$, le test étant
bilatéral il ne nous dit pas si $\mu > \mu_0$ ou bien $\mu < \mu_0$.
OK, faisons alors deux tests billatéraux ($H^1_0 : \mu = \mu_0$ contre
$H^1_1 < \mu_0$ et $H^2_0 : \mu = \mu_0$ contre $H^2_1 : \mu > \mu$).
Toujours avec $\alpha = 0.05$ on a une valeur critique à $\pm 1.64$ selon
le test. Oui mais, il faut alors appliquer une correction pour les
tests multiples. Soyons conservatifs et utilisons la correction
de Bonferroni, il nous faut alors travailler avec $alpha/2$
pour chaque test. On retombe alors sur extactement la même valeur
critique que pour le test billatéral à $\pm 1.96$ !!!
-
+lundi 7 avril 2008
-lundi 7 avril 2008
Marie Laure Delignette-Muller nous a présenté le cours d’introduction à l’inférence bayésienne qui lui a été demandé de préparer pour un concours de Professeur à l’école vétérinaire
[PDF].
Carlos Bernteinnous a présenté une introduction aux méthodes utilisées en dynamique adaptative.
[PDF].
-
+lundi 2 juin 2008
-lundi 2 juin 2008
Jean-Pierre Flandrois nous a présenté SVIPP : un outil ridiculement petit de simulation de la vie en placettes.
[PDF]. Un exemple de GIF animée est donnée ci-dessous, d’autres exemples à télécharger sont disponibles [ici] et [là].

- fumeur noir (cellules)
Vincent Miele nous a présenté MixNet pour
modéliser les hétérogéneités de connectivité (par exemple les hubs, les noeuds périphériques, les cliques, etc…) au sein des réseaux [PDF].
-
+mardi 2 septembre 2008
-mardi 2 septembre 2008
Petit bilan de l’axe méthodologique après 45 exposés : contributions par départements et par équipes, bilan financier
[PDF].
Sandrine Charles nous a présenté une
modélisation de la propagation des rotavirus (gastro) dans un service
pédiatrique en milieu hospitalier [PDF].
Christian Gautier nous a présenté une
approche par simulation pour l’enseignement à des biologistes du sens des
p-values [R] [PDF].
-
+lundi 6 octobre 2008
-lundi 6 octobre 2008
Le lundi 6 octobre est à marquer d’une pierre blanche dans les annales de l’axe méthodologique : nous avons été pendus pendant deux heures aux lèvres d’Alain Guerreau sur le thème des statistique pour (chez ?) les historiens. Alain Guerreau est DR1 CNRS, il est historien spécialisé dans le moyen-âge (on parle d’historien médiéviste) avec une prédilection pour la Bourgogne, sa terre de prédilection. Il nous a exposé, sur un mode certes provocateur mais néamoins fondé, le fossé qu’il existe entre l’accumultation de données (les historien parlent de corpus) et l’absence de volonté d’en extraire du sens. Les scientifiques présents ont retrouvé ici des échos familiers : la science est encombrée de résultats inutiles, la moitié des articles scientifiques publiés ne sont jamais cités, y compris par leur propres auteurs. Nous accumulons des données (de physique, d’astronomie, de génomique, de transcriptomique, de protéomique) mais qui se soucie d’y trouver un sens ? Alain Guerreau propose dépasser le stade du structuralisme (graphe) pour quantifier la vraisemblance des relations (graphe valué), mais le combat n’est pas gagné d’avance ! Pour ce qui est des outils on retombe sur les valeurs sûres de la statistique descriptive multivariée (AFC, ACM, etc.) mais de nombreuses lacunes sont présentes tant au niveau de la formation initiale et de la motivation des futurs conservateurs (école nationale des chartes), que des outils exploratoires disponibles (graphiques), que de la méthodologie de codage de la description des systèmes complexes, étape essentielle, mais peu formalisée.
Bref, pour ceux qui ont raté le coche, vous pouvez toujours vous régaler de Statistiques pour historiens par Alain Guerreau disponible en ligne
ici.
J’attire votre attention sur les passages sur le logiciel libre qui sont tout à fait exceptionnels (c’est écrit en français, pas par des geeks).
-
+mardi 4 novembre 2008
-mardi 4 novembre 2008
Eric Tannier nous a présenté une question biologique posée pour la (presque) première fois par le généticien Seymour Benzer en 1959 ayant conduit à une riche littérature sur le problème des uns consécutifs dans une matrice binaire [PDF].
Marc Bailly-Bechet nous a présenté une version méthodologique de ses travaux de thèse : classification et équations maîtresses [PDF].
Suite à l’exposé d’Anne Viallefont, un exemple de sélection de modèle pour constituer un thermomètre moléculaire protéomique [PDF].
-
+mardi 3 mars 2009
-mardi 3 mars 2009
Un axe méthodologique pour les amateurs de CSI Las Vegas,
CSI Miami et CSI Manhattan. Une présentation de Laurent Pene, expert au laboratoire de police scientifique de Lyon (responsable de la section biologie), sur l’analyse génétique appliquée à la criminalistique [PDF].
-
+lundi 6 avril 2009
-lundi 6 avril 2009
Une conférence de Geneviève Azam, enseignante-chercheuse à l’Université de Toulouse II, intitulée "Du processus de Bologne à la loi L.R.U., une catastrophe annoncée." [avi].
-
+lundi 8 juin 2009
-lundi 8 juin 2009
Nous avons eu une guest star en la personne de Susan Holmes
qui est professeur à Stanford (merci de ne pas confondre avec l’autre Susan Holmes).
Susan est bien connue des services de renseignements intérieurs du laboratoire parce qu’elle a publié un article intitulé Multivariate Data Analysis : The French Way que vous trouverez dans la page des liens du site de biostatistiques.
Elle a également publié un article pour pouvoir tricher au jeu de pile ou face (oui c’est possible). Sa conférence était intitulée Looking at the Data : All the Data (PDF) L’article correspondant dans Journal of Statistical Software est ici.
-
+Mardi 3 novembre 2009
-Mardi 3 novembre 2009
Jean-Pierre Flandrois nous a présenté une recherche de Frédérique Billy sur l’origine du modèle de croissance dit de Gompertz [PDF]. L’article originel de Gompertz datant de 1825 est disponible [ici], il devrait vous permettre de mieux comprendre les difficultés de Champollion devant les hiéroglyphes. Un article plus récent de Winsor en 1932 permet de retracer l’origine du modèle [PDF]. Enfin, l’hagiographie de Hooker contient de nombreuses références bibliographiques sur les travaux de Gompertz [PDF].
Anne-Béatrice Dufour et Jean Lobry nous ont présenté une démonstration d’odfWeave qui est un paquet R qui permet d’intégrer automatiquement des résultats d’analyses statistiques (calculs, tables et dessin) dans un document openOffice. Les fichiers utilisés pour cette démo sont disponible ici pour le fichier d’entrée et là pour le fichier de sortie. Comme ces documents ne sont pas complets, il est préférable d’aller consuster la dernière version mise en ligne sur le site pédagogique ici.
Marc Bailly-Bechet nous a présenté un problème qui semble simple de prime abord mais qui en fait ne l’est pas : comment analyser l’usage du code d’un génome sous la double contrainte du respect des fréquences en acides-aminés et des fréquences globales des 4 bases ? La principale difficulté dans le code génétique universel vient des sextets (Leu, Ser et Arg) [PDF].
-
+mardi 1 décembre 2009
-mardi 1 décembre 2009
Cet axe méthodologique a eu lieu en plein pic de pandémie grippale. Jean-Pierre Flandrois nous a présenté le site de google flu qui permet de prédire le niveau d’infection en fonction des requêtes des internautes.
Jean-Pierre Flandrois nous a présenté un article de synthèse en français qui fait le point sur les nouvelles technologies de séquençage massif [PDF].
Jean Lobry nous a présenté le chemin qu’il reste à parcourir avant de disposer enfin du génome complet de toutes les cellules de tous les organismes vivants sur terre [PDF].
Il existe un groupe de travail informel (informel mais fait pour travailler) autour de la bioinformatique liée aux données issues des séquençages massifs, pour en savoir plus contacter Franck Picard.
Enfin, le scoop était que Jean Lobry va prendre la direction du laboratoire de police scientifique de Lyon. L’animation de l’axe méthodologique sera désormais assurée par Anne B. Dufour. La prochaine réunion de l’axe méthodologique est prévue pour le lundi 1 février 2010.
Groupes de travail