Cette formation est dédiée à l’analyse de données métagénomiques procaryotes de type « shotgun » issues de la technologie de séquençage Illumina. Nous présenterons les étapes bioinformatiques nécessaires pour nettoyer les données brutes et les caractériser d’un point de vue taxonomique. Nous aborderons ensuite les différentes stratégies à employer pour assembler les reads et obtenir des comptages sur des gènes prédits. Enfin nous présenterons quelques outils pour obtenir une annotation fonctionnelle des échantillons. A l’issue des 2 jours de formation, les stagiaires connaîtront le périmètre, les avantages et limites des analyses de données de séquençage shotgun. Ils seront capables d’utiliser les outils présentés sur les jeux de données de la formation. L’ensemble des TP se déroulera sur l’infrastructure de Migale et nécessite une pratique courante de la ligne de commande.
Programme
Introduction générale sur les données métagénomiques Assignation taxonomique Nettoyage des données brutes Assemblage / Binning Prédiction de gènes procaryotes Annotation fonctionnelle Conclusion, limites des méthodes