Objectifs Cette formation est dédiée à l'analyse de données de type "métagénomique amplicon" issues des technolo-gies de séquençage 454 et Illumina. La formation couvre les grandes étapes d'un pipeline d'analyse bioinformatique sous Galaxy (FROGS) pour transformer les séquences en tables d'abondances puis présente des outils statistiques sous R (phyloseq) qui permettent de décrire et comparer les échantillons à partir de ces tables.
Programme
Jours 1 et 2 : Analyses Bioinformatiques sous Galaxy Introduction générale Brefs rappels sur l'environnement Galaxy Présentation des données issues des différentes technologies de séquençage Prétraitement des données Clustering des séquences, construction des OTUs Détection de chimères Annotation taxonomique Filtrage des données de comptages Outils de visualisation Construction de workflow et configuration de FROGS Limite des données et des méthodes Jour 3 et 4 : Analyses Statistiques sous Rstudio Introduction générale Import, manipulation et visualisation des données Mesure de diversités : Unifrac, Bray-Curtis, etc. Ordination et réduction de dimension : MDS Clustering et Heatmap Comparaison d'échantillons : PERMANOVA, adonis ▫ Introduction générale ▫ Brefs rappels sur l'environnement Galaxy ▫ Présentation des données issues des différentes technologies de séquençage ▫ Prétraitement des données ▫ Clustering des séquences, construction des OTUs ▫ Détection de chimères ▫ Annotation taxonomique ▫ Filtrage des données de comptages ▫ Outils de visualisation ▫ Construction de workflow et configuration de FROGS ▫ Limite des données et des méthodes
Jour 3 : Analyses Statistiques sous Rstudio
▫ Introduction générale
▫ Import et manipulation des données
▫ Mesure de diversités : Unifrac, Bray-Curtis, etc.