L'utilisation de plus en plus répandue de techniques d’imagerie et de séquençage à haut-débit en biologie est en train de révolutionner les sciences du vivant et de modifier en profondeur leurs pratiques. Dans ce contexte, des outils statistiques sont développés pour permettre d’analyser ces données de hautes dimensions, et la maîtrise de ces outils devient de plus en plus nécessaire pour produire des résultats de bonne qualité. Ce cours de 4 semaines couvrira les étapes nécessaires pour mettre en place un processus d’analyse de données, depuis la planification de l’expérience jusqu’à la fouille des données en passant par l’échantillonnage, les test d’hypothèses, la modélisation statistique etc.
Ce cours s’adresse en priorité aux étudiants de première année de thèse de l’Institut Pasteur. Tout étudiant en thèse sera automatiquement inscrit à ce cours, mais les élèves de 2e année, de 3e année ou les post-doctorants peuvent également s’inscrire, dans la limite des places disponibles. Il est à noter que le cours est obligatoire pour les étudiants de 1ère année. Des dispenses partielles ou totales sont possibles pour les étudiants qui ont déjà des connaissances en statistique, en mathématique ou en physique. Le cours déroulera sur 4 semaines, 4 jours par semaine, trois heures par jour. Chaque séance de trois heures alternera cours magistral et mise en pratique. Il y aura deux sessions : la première commencera le 22 octobre 2018 et la deuxième le 14 janvier 2019.
Chacune de ces deux sessions sera précédée d’une séance d’introduction à l’informatique. Cette séance proposera des notions d’architecture de l’ordinateur, de système d’organisation des fichiers et de format de fichiers. Chaque session sera également suivie d’un cours optionnel sur l’analyse et le traitement des images.
Pour plus d’information, ainsi que pour les inscriptions au module optionnel et les demandes d’exemption, rendez-vous sur la page du cours : https://c3bi.pasteur.fr/introduction-to-data-analysis-2018-19/
Thèmes abordés
Le module d’analyse de données couvrira un large champ de notions nécessaires aux étudiants pour planifier leurs expériences, analyser et explorer leurs données, interpréter les résultats et générer des figures à des fins de publication. Il abordera des notions de base en statistique, dont les analyses uni- et multivariées, les analyses descriptives, les distributions statistiques usuelles utilisées en biologie, ainsi que les tests d’hypothèses. Les exercices et travaux pratiques seront réalisés avec R et RStudio. Plusieurs séances seront consacrées à une introduction à l’utilisation du langage de programmation R avant d’aborder les notions de statistiques et d’analyse de données.
Le module d’analyse d’images introduira les principes de base de l’analyse d’image, et portera plus particulièrement sur l’extraction d’information quantitative d’images de microscopie. Ce cours est destiné aux personnes ayant peu ou pas d’expérience en analyse d’image. Il sera très orienté sur la pratique : des cours magistraux de courte durée seront immédiatement suivis de sessions pratiques. Il aidera à la fois les microscopistes débutants et experts qui n’ont jamais eu de formation concrète en analyse d’image.