11ème Ecole de Bioinformatique AVIESAN-IFB-Inserm
La formation s’adresse à des biologistes directement impliqués dans des projets “Next Generation Sequencing” (NGS). Cette édition de l’école aborde les nouveaux enjeux technologiques: elle s’articulera autour de trois ateliers thématiques en session parallèle (RNA-seq, ChIP-seq/ATAC-seq, variants DNA-seq), et inclura une introduction à l’intégration des données, une ouverture aux approches “single-cell” ainsi qu’aux technologies “long reads”.
L’école vise à introduire les concepts et à manipuler les outils informatiques et à en interpréter les résultats. Elle est basée sur une alternance de courtes sessions théoriques et d’ateliers pratiques. Les participants bénéficieront d’un tutorat personnalisé pour élaborer leur plan d’analyse, et effectuer les premières étapes de traitement de leurs propres données ou de celles de leur plateforme.
Cours MIGALE - Analyse de données métagénomiques 16S
Formation dédiée à l'analyse de données de type "métagénomique amplicon" issues des technolo-gies de séquençage 454 et Illumina.
Formation MIGALE - Initiation à R
Formation MIGALE - Annotation de génomes microbiens
Module en préparation ...
Analyse primaire de données issues de séquenceurs nouvelle génération sous Galaxy : 2025
Objectifs pédagogiques
Connaître les concepts et méthodes bioinformatiques utilisés pour l’analyse primaire de données issues de séquenceurs nouvelle génération (NGS). Savoir effectuer un alignement sur un génome de référence, un assemblage de novo d’un génome bactérien
Programme
Théorie
* Présentation des différents types de technologies de séquençage (lectures longues et courtes)
Pratique : Analyse des données de séquençage d’un génome bactérien
* Contrôle qualité
* Assemblage de-novo
* Nettoyage des données
* Assemblage
* Visualisation et statistiques sur l’assemblage
* Alignement de lectures sur un génome de référence et visualisation
Tous les TPs seront réalisés sous l’environnement d’exécution de traitements Galaxy.
Graphiques sous R avec ggplot2 / Graphics with R-ggplot2 (2023 session )
Objectifs pédagogiques :
À l’issue de la formation, les stagiaires connaîtront les principales fonctionnalités du package R « ggplot2 » et la démarche sous-jacente pour construire un graphique à partir d’un tableau de données. Ils seront capables de réaliser plusieurs types de représentations graphiques, telles que des nuages de points, des courbes, des histogrammes, des diagrammes en bâtons, des boxplots, des heatmaps, etc. Les stagiaires pourront apporter leur propre tableau de données et pratiquer dessus en fin de formation.
Programme :
- Principes généraux liés au package ggplot2
- Principales fonctions graphiques pour réaliser des nuages de points, des histogrammes, des boxplots, etc.
- Principales fonctions pour jouer sur les coloriages en fonction d’une variable, sur les échelles de couleurs, sur les graduations, sur les représentations multiples, etc.
Graphiques sous R avec ggplot2 / Graphics with R-ggplot2 (2024 session)
Objectifs pédagogiques :
À l’issue de la formation, les stagiaires connaîtront les principales fonctionnalités du package R « ggplot2 » et la démarche sous-jacente pour construire un graphique à partir d’un tableau de données. Ils seront capables de réaliser plusieurs types de représentations graphiques, telles que des nuages de points, des courbes, des histogrammes, des diagrammes en bâtons, des boxplots, des heatmaps, etc. Les stagiaires pourront apporter leur propre tableau de données et pratiquer dessus en fin de formation.
Programme :
- Principes généraux liés au package ggplot2
- Principales fonctions graphiques pour réaliser des nuages de points, des histogrammes, des boxplots, etc.
- Principales fonctions pour jouer sur les coloriages en fonction d’une variable, sur les échelles de couleurs, sur les graduations, sur les représentations multiples, etc.
Introduction au language R / Introduction to R langage (2024 session)
Objectifs pédagogiques :
À l’issue de la formation, les stagiaires connaîtront les principales fonctionnalités du langage R et ses principes. Ils seront capables de les appliquer pour effectuer des calculs ou des représentations graphiques simples. Ils seront de plus autonomes pour manipuler leurs tableaux de données.
Attention : ce module n’est ni un module de statistique, ni un module d’analyse statistique des données.
Programme :
* Structures et manipulation de données
* Principaux éléments du langage de programmation (boucle, fonctions…)
* Différentes représentations graphiques de données/résultats (plot, histogramme, boxplot)
Développement d’une application avec R Shiny (session 2024)
Objectifs pédagogiques
À l’issue de la formation, les stagiaires connaîtront les principes de bases et le fonctionnement du package “Shiny”. Ils et elles seront capables de créer leurs premières applications web interactives à partir de scripts R. Les solutions de déploiement d’applications Shiny seront également abordées.
Programme
Principes généraux et fonctionnement d’une application Shiny
Développement d’applications Shiny
Déploiement d’applications Shiny
Manipulation de données avec R, introduction à tidyverse : 2025
Objectifs pédagogiques
A l’issue de la formation, les stagiaires seront capables de :
* utiliser les principales fonctions des packages dplyr et tidyr de l’écosystème du « tidyverse »
* lire les données et les ranger dans un format « tidy »
* manipuler les données : filtrer, sélectionner, trier, produire des résultats par groupe, fusionner plusieurs tables
* mettre en forme et pivoter les tables de données
Programme
* Principes du tidyverse
* Principales fonctions de manipulation de données du package dplyr : ajouter de nouvelles variables, sélectionner des colonnes, filtrer des lignes, trier, grouper, fusionner des tables
* Enchaînements des opérations à l’aide de « pipe »
* Mise en forme, jointure et pivot de données avec le package tidyr
* Mise en application sur un exemple d’analyse de données de transcriptomique.
Analyse de données métagénomiques shotgun / shotgun metagenomics (2024 session)
Objectifs pédagogiques
Cette formation est dédiée à l’analyse de données métagénomiques procaryotes de type « shotgun » issues de la technologie de séquençage Illumina. Nous présenterons les étapes bioinformatiques nécessaires pour nettoyer les données brutes et les caractériser d’un point de vue taxonomique. Nous aborderons ensuite les différentes stratégies à employer pour assembler les reads et obtenir des comptages sur des gènes prédits. Enfin nous présenterons quelques outils pour obtenir une annotation fonctionnelle des échantillons. A l’issue des 2 jours de formation, les stagiaires connaîtront le périmètre, les avantages et limites des analyses de données de séquençage shotgun. Ils seront capables d’utiliser les outils présentés sur les jeux de données de la formation. L’ensemble des TP se déroulera sur l’infrastructure de Migale et nécessite une pratique courante de la ligne de commande.
Programme
Introduction générale sur les données métagénomiques
Assignation taxonomique
Nettoyage des données brutes
Assemblage / Binning
Prédiction de gènes procaryotes
Annotation fonctionnelle
Conclusion, limites des méthodes
Traitement bioinformatique et analyse différentielle de données d’expression RNA-seq sous Galaxy (session 2024)
Objectifs pédagogiques
A l’issue de cette formation, vous serez capable, dans le cadre d’une analyse de données RNA- seq avec génome de référence et plan d’expérience simple :
* de connaître le vocabulaire et les concepts bioinformatiques et biostatistiques ;
* de savoir enchaîner de façon pertinente un ensemble d’outils bioinformatiques et biostatistiques dans l’environnement Galaxy ;
* de comprendre le matériel et méthodes d’un article du domaine ;
* d’évaluer la pertinence d’une analyse RNA-seq en identifiant les éléments clefs et comprendre les particularités liées à la nature des données.
Programme
Bioinformatique :
* Obtenir des données de qualité : nettoyage, filtrage, qualité
* Aligner les lectures sur un génome de référence
* Détecter de nouveaux transcrits
* Quantifier l’expression des gènes
* Préparer et déployer unensemble d’analyses sur plusieurs échantillons
Biostatistique :
* Construire un plan d’expérience simple
* Normaliser les données de comptage
* Identifier les gènes différentiellements exprimés
* Se sensibiliser aux tests multiples
Analyse de protocoles Bioinformatique et Biostatistiques issus de la littérature
1ère Ecole de Bioinformatique AVIESAN-IFB-Inserm Niveau 2
Initiation au traitement des données de génomique obtenues par séquençage à haut débit -- Niveau 2
Introduction aux bonnes pratiques pour des analyses reproductibles (2024 session)
Objectifs pédagogiques
L’objectif de cette formation est d’initier les apprenants aux bonnes pratiques pour la reproductibilité des analyses. Ils apprendront à rédiger des rapports d’analyse en R Markdown et à les déposer sur un dépôt GitHub. Les principes FAIR (faciles à trouver, accessibles, interopérables et réutilisables) et les bases de la rédaction de PGD (plans de gestion de données) seront également présentés. Durant la formation, nous utiliserons RStudio et GitHub.
Programme
Principes et enjeux de la recherche reproductible
Utilisation de GitHub
Gestion des versions d’un document
Rédaction de document computationnel
Partage d’un rapport avec ses collaborateurs
Principes FAIR et PGD
Initiation à Python / Introduction to Python (2024 session)
Objectifs pédagogiques
A l’issue de la formation, les stagiaires seront capables de :
maitriser les éléments de base du langage de programmation Python,
les appliquer sur des cas concrets en bioinformatique,
être autonome dans la mise en place de tâches simples d’extraction d’informations, dans le cadre de traitement de données via le langage de programmation Python.
Programme
Présentation de Python
Variables Python
Structures de contrôle
Gestion de fichiers
Réalisation de programmes simples et de Notebooks Jupyter
Mise en pratique avec des exercices de manipulation de fichiers de séquences
Objectifs pédagogiques
A l’issue de la formation, les stagiaires seront capables de :
connaître les éléments avancés du langage de programmation Python,
les appliquer sur des cas concrets en bioinformatique,
être autonome dans la mise en place de tâches complexes visant à extraire et re-formater des données issues de fichiers textes,
dans le cadre de traitement de données via le langage de programmation Python
Programme
Fonctions
Expressions régulières
Gestion des erreurs
Biopython
Quelques modules de bioinformatique
Réalisation de programmes et de Notebooks Jupyter
Illustration avec des exercices de manipulation de fichiers de séquences
Comparaison de génomes microbiens (session 2024)
Objectifs pédagogiques
Connaître les concepts et les principales méthodes bioinformatiques pour comparer un jeu de données de génomes microbiens. Construire et évaluer la qualité d’un jeu de données. Savoir mettre en œuvre une comparaison de génomes et en interpréter les résultats.
Programme
* Construction d’un jeu de données :
* Téléchargement de données publiques
* Evaluation de la qualité
* Caractérisation de la diversité génomique
* Stratégies de comparaison :
* Construction de famille de protéines
* Alignement de génomes complets
* Analyse des résultats :
o Notion de core et pan-génome
o Notions élémentaires de phylogénomique
o Visualisation et interprétation des résultats
* Mise en pratique sur un jeu de données bactériens, utilisation des logiciels dRep et Roary sous Galaxy.
3ème Ecole de Bioinformatique AVIESAN
Les domaines des sciences du vivant liés à l’analyse du génome ont vu au cours des dernières années une
accumulation explosive des données provenant des techniques de séquençage à haut débit. Les progrès accomplis ont
considérablement augmenté les possibilités expérimentales dans des domaines tels que la génomique (séquençage de
nouveaux génomes, variants génétiques), la transcriptomique (expression génétique, ARNs non codants) et les
interactions ADN-protéine (immuno-précipitation de chromatine) et modifications de la chromatine. AVIESAN organise
une troisième session de cette école dont les objectifs sont d’apporter aux biologistes des notions et une pratique leur
permettant d’appréhender le traitement et l’analyse des données de séquençage à haut débit en utilisant un
environnement logiciel convivial : Galaxy.
L’école comportera des séminaires introductifs, des cours et des travaux pratiques consacrés à l’initiation au traitement
des données de transcriptome (RNA-seq), d’interactome (ChIP-seq) et de variations génomiques (SNP, CNV). Les
participants disposant de données pourront discuter de leur plan d’analyse et effectuer les premières étapes de
traitement de leurs données au cours de la dernière journée.
L’école est une initiation à l’utilisation des outils bioinformatiques dans un environnement Galaxy, plateforme dédiée à
l’analyse des données de séquençage à haut débit. Cette formation est destinée aux biologistes (chercheurs,
doctorants, enseignants-chercheurs, ingénieurs, …) ayant déjà utilisé ou souhaitant utiliser ce type de données.
9ème Ecole de Bioinformatique AVIESAN-IFB-Inserm
La formation s’adresse à des biologistes directement impliqués dans des projets “Next Generation Sequencing” (NGS). Cette édition de l’école aborde les nouveaux enjeux technologiques: elle s’articulera autour de trois ateliers en session parallèle (RNA-seq, ChIP-seq, variants DNA-seq), et inclura une introduction à l’intégration des données, ouverture aux approches “single-cell” ainsi qu’aux technologies lectures longues (Nanopore, PacBio).
L’école vise à introduire les concepts et à manipuler les outils informatiques et à en interpréter les résultats. Elle est basée sur une alternance de courtes sessions théoriques et d’ateliers pratiques. Les participants bénéficieront d’un tutorat personnalisé pour élaborer leur plan d’analyse, et effectuer les premières étapes de traitement de leurs propres données ou de celles de leur plateforme.
Développement d’une application avec R Shiny : session 2025
Objectifs pédagogiques
À l’issue de la formation, les stagiaires connaîtront les principes de bases et le fonctionnement du package “Shiny”. Ils et elles seront capables de créer leurs premières applications web interactives à partir de scripts R. Les solutions de déploiement d’applications Shiny seront également abordées.
Programme
Principes généraux et fonctionnement d’une application Shiny
Développement d’applications Shiny
Déploiement d’applications Shiny
10ème Ecole de Bioinformatique AVIESAN-IFB-Inserm
La formation s’adresse à des biologistes directement impliqués dans des projets “Next Generation Sequencing” (NGS). Cette édition de l’école aborde les nouveaux enjeux technologiques: elle s’articulera autour de trois ateliers thématiques en session parallèle (RNA-seq, ChIP-seq/ATAC-seq, variants DNA-seq), et inclura une introduction à l’intégration des données, une ouverture aux approches “single-cell” ainsi qu’aux technologies “long reads”.
L’école vise à introduire les concepts et à manipuler les outils informatiques et à en interpréter les résultats. Elle est basée sur une alternance de courtes sessions théoriques et d’ateliers pratiques. Les participants bénéficieront d’un tutorat personnalisé pour élaborer leur plan d’analyse, et effectuer les premières étapes de traitement de leurs propres données ou de celles de leur plateforme.
Analyse primaire de données issues de séquenceurs nouvelle génération sous Galaxy
Connaître les concepts et méthodes bioinformatiques utilisés pour l’analyse primaire de données issues de séquenceurs nouvelle génération (NGS).
Savoir effectuer un alignement sur un génome de référence, un assemblage de novo d'un génome bactérien.
4ème Ecole de Bioinformatique AVIESAN
La formation s’adresse à des biologistes directement impliqués dans des projets “Next Generation Sequencing” (NGS). Cette édition de l’école aborde les nouveaux enjeux technologiques: elle s’articulera autour de trois ateliers en session parallèle (RNA-seq, ChIP-seq, variants DNA-seq).
L’école vise à introduire les concepts et à manipuler les outils informatiques et à en interpréter les résultats. Elle est basée sur une alternance de courtes sessions théoriques et d’ateliers pratiques. Les participants bénéficieront d’un tutorat personnalisé pour élaborer leur plan d’analyse, et effectuer les premières étapes de traitement de leurs propres données ou de celles de leur plateforme.
Manipulation de données avec R : introduction à tidyverse
A l’issue de la formation, les stagiaires seront capables de :
- utiliser les principales fonctions des packages dplyr et tidyr de l’écosystème du « tidyverse »
- lire les données et les ranger dans un format « tidy »
- manipuler les données : filtrer, sélectionner, trier, produire des résultats par groupe, fusionner plusieurs tables
- mettre en forme et pivoter les tables de données
Initiation à Linux / Introduction to Linux (2024 session)
Objectifs pédagogiques
À l'issue de la formation, les stagiaires connaîtront les principales commandes Linux et sauront utiliser le système Linux.
Programme
* Connexion (ssh) et transferts de fichiers (scp, rsync)
* Interfaces graphiques (Gnome, KDE) / émulateurs
* Aide en ligne
* Utilisation du shell : le rappel des commandes, l’historique, la complétion
* Système de fichiers : arborescence et chemin d’accès, le répertoire d’accueil…
* Gestion des fichiers et des répertoires
* Principe de protection : les attributs sur les fichiers, les droits d’accès
Formation MIGALE - Analyse statistique RNA-seq sous Galaxy
Recherche des régions d'intérêt différentiellement exprimées (R, RStudio et Galaxy)
Annotation et comparaison de génomes bactériens : 2025
Objectifs pédagogiques
Connaître les concepts et les principales méthodes bioinformatiques pour comparer un jeu de données de génomes microbiens. Construire et évaluer la qualité d’un jeu de données. Savoir mettre en œuvre une comparaison de génomes et en interpréter les résultats.
Programme
* Construction d’un jeu de données :
* Téléchargement de données publiques
* Evaluation de la qualité
* Caractérisation de la diversité génomique
* Stratégies de comparaison :
* Construction de famille de protéines
* Alignement de génomes complets
* Analyse des résultats :
o Notion de core et pan-génome
o Notions élémentaires de phylogénomique
o Visualisation et interprétation des résultats
* Mise en pratique sur un jeu de données bactériens, utilisation des logiciels dRep et Roary sous Galaxy.
Formation MIGALE - Initiation à Perl
Initiation à la programmation. Identifier les possibilités offertes par l’écriture de quelques lignes de code...
Introduction au language R / Introduction to R langage : 2025
Objectifs pédagogiques :
À l’issue de la formation, les stagiaires connaîtront les principales fonctionnalités du langage R et ses principes. Ils seront capables de les appliquer pour effectuer des calculs ou des représentations graphiques simples. Ils seront de plus autonomes pour manipuler leurs tableaux de données.
Attention : ce module n’est ni un module de statistique, ni un module d’analyse statistique des données.
Programme :
* Structures et manipulation de données
* Principaux éléments du langage de programmation (boucle, fonctions…)
* Différentes représentations graphiques de données/résultats (plot, histogramme, boxplot)
Analyse statistique de données RNA-Seq - Recherche des régions d’intérêt différentiellement exprimées (2024)
Objectifs pédagogiques
* Se sensibiliser aux concepts et méthodes statistiques pour l’analyse de données transcriptomiques de type RNA-Seq.
* Comprendre le matériel et méthodes (normalisation et tests statistiques) d’un article.
* Réaliser une étude transcriptomique avec R dans l’environnement RStudio.
Programme
* Planification expérimentale des expériences RNA-Seq (identification des biais, répétitions, biais contrôlables).
* Normalisation et analyse différentielle : recherche de “régions d’intérêt” différentiellement exprimées (modèle linéaire généralisé).
*Prise en compte de la multiplicité des tests.
Le cours sera illustré par différents exemples. Un jeu de données à deux facteurs sera analysé avec les packages R DESeq2 et edgeR dans l’environnement RStudio.
Introduction au text-mining avec AlvisNLP (session 2024)
Objectifs pédagogiques
Cette formation est dédiée à l’analyse de données textuelles (text-mining). L’objectif est l’acquisition des principales techniques pour la Reconnaissance d’Entités Nommées (REN) à partir de textes. Les entités nommées étudiées dans cette formation sont des objets ou concepts d’intérêts mentionnés dans les articles scientifiques ou les champs en texte libre (taxons, gènes, protéines, marques, etc.).
Les participants vont acquérir les compétences pratiques nécessaires pour effectuer de façon autonome une première approche pour une application de text-mining. Le format est celui de Travaux Pratiques utilisant AlvisNLP, un outil pour la création de pipelines en text-mining développé par l’équipe Bibliome de l’unité MaIAGE. La formation s’adresse à des chercheurs et ingénieurs en (bio)-informatique ou en maths-info-stats appliquées
Programme
* Présentation du text-mining et de la Reconnaissance des Entités Nommées (REN)
* Travaux Pratiques sur des techniques de REN en utilisant AlvisNLP
* Projection de lexiques
* Application de patrons
* Apprentissage automatique
Ecole de Bioinformatique AVIESAN-IFB-Inserm Niveau 2
Initiation au traitement des données de génomique obtenues par séquençage à haut débit -- Niveau 2
Analyse fonctionnelle et interprétation de données de protéomique avec ProteoRE
Mis en oeuvre des outils de la plate-forme web ProteoRE pour l'annotation des protéomes
12ème Ecole de Bioinformatique AVIESAN-IFB-Inserm
La formation s’adresse à des biologistes directement impliqués dans des projets “Next Generation Sequencing” (NGS). Cette édition de l’école aborde les nouveaux enjeux technologiques: elle s’articulera autour de quatres ateliers thématiques en session parallèle (RNA-seq, ChIP-seq/ATAC-seq, variants DNA-seq, single-cell), et inclura une introduction à l’intégration des données, une ouverture aux technologies “long reads”.
L’école vise à introduire les concepts et à manipuler les outils informatiques et à en interpréter les résultats. Elle est basée sur une alternance de courtes sessions théoriques et d’ateliers pratiques. Les participants bénéficieront d’un tutorat personnalisé pour élaborer leur plan d’analyse, et effectuer les premières étapes de traitement de leurs propres données ou de celles de leur plateforme.
Graphiques sous R avec ggplot2 : 2025
Objectifs pédagogiques :
À l’issue de la formation, les stagiaires connaîtront les principales fonctionnalités du package R « ggplot2 » et la démarche sous-jacente pour construire un graphique à partir d’un tableau de données. Ils seront capables de réaliser plusieurs types de représentations graphiques, telles que des nuages de points, des courbes, des histogrammes, des diagrammes en bâtons, des boxplots, des heatmaps, etc. Les stagiaires pourront apporter leur propre tableau de données et pratiquer dessus en fin de formation.
Programme :
- Principes généraux liés au package ggplot2
- Principales fonctions graphiques pour réaliser des nuages de points, des histogrammes, des boxplots, etc.
- Principales fonctions pour jouer sur les coloriages en fonction d’une variable, sur les échelles de couleurs, sur les graduations, sur les représentations multiples, etc.
Manipulation de données avec R, introduction à tidyverse (session 2024)
Objectifs pédagogiques
A l’issue de la formation, les stagiaires seront capables de :
* utiliser les principales fonctions des packages dplyr et tidyr de l’écosystème du « tidyverse »
* lire les données et les ranger dans un format « tidy »
* manipuler les données : filtrer, sélectionner, trier, produire des résultats par groupe, fusionner plusieurs tables
* mettre en forme et pivoter les tables de données
Programme
* Principes du tidyverse
* Principales fonctions de manipulation de données du package dplyr : ajouter de nouvelles variables, sélectionner des colonnes, filtrer des lignes, trier, grouper, fusionner des tables
* Enchaînements des opérations à l’aide de « pipe »
* Mise en forme, jointure et pivot de données avec le package tidyr
* Mise en application sur un exemple d’analyse de données de transcriptomique.
Formation MIGALE - Initiation à Python
Initiation à la programmation. Réalisation de tâches simples d'extractions d'informations.
Initiation à l’utilisation de Galaxy : 2025
Objectifs pédagogiques :
Cette formation propose une introduction sur l’interface utilisateur et les fonctionnalités générales d’une plateforme Galaxy.
A l’issue de la formation, les apprenants seront en mesure de :
* connaître les caractéristiques et le fonctionnement d’un portail Galaxy,
* appliquer sur des cas concrets en bioinformatique,
* être autonome dans le traitement de fichiers et l’exécution d’outils.
Programme :
* Prise en main d’un portail Galaxy
* Utilisation de l’historique
* Téléchargement des données à traiter
* Manipulation de fichiers
* Paramétrage et exécution d’outils
* Récupération et visualisation de résultats
8ème Ecole de Bioinformatique AVIESAN-IFB-Inserm
La formation s’adresse à des biologistes directement impliqués dans des projets “Next Generation Sequencing” (NGS). Cette édition de l’école aborde les nouveaux enjeux technologiques: elle s’articulera autour de trois ateliers en session parallèle (RNA-seq, ChIP-seq, variants DNA-seq), et inclura une introduction à l’intégration des données, ouverture aux approches “single-cell” ainsi qu’aux technologies lectures longues (Nanopore, PacBio).
L’école vise à introduire les concepts et à manipuler les outils informatiques et à en interpréter les résultats. Elle est basée sur une alternance de courtes sessions théoriques et d’ateliers pratiques. Les participants bénéficieront d’un tutorat personnalisé pour élaborer leur plan d’analyse, et effectuer les premières étapes de traitement de leurs propres données ou de celles de leur plateforme.
Analyse statistique de données RNA-Seq - Recherche des régions d'intérêt différentiellement exprimées (R, RStudio)
Se sensibiliser aux concepts et méthodes statistiques pour l'analyse de données transcriptomiques de type RNA-Seq.
Apprendre les principales fonctionnalités du langage R et ses principes
Formation MIGALE - Modélisation 3D des protéines
Analyse in silico de structures 3D de protéines. Modélisation par homologie de protéines homologues, sauvage et mutées...
Cours MIGALE - Perl avancé
Aller plus loin avec Perl afin d’être autonome pour des manipulations complexes visant à extraire et reformater des données iss...
Formation MIGALE - Python avancé
Etre autonome pour des manipulations simples visant à extraire, reformater des données issues de fichiers texte.
Analyse de données métagénomiques 16S
Cette formation est dédiée à l'analyse de données de type "metabarcoding" issues de la technologie de séquençage Illumina.
Formation MIGALE - Traitements bioinfo RNA-seq
Traitement bioinformatique des données RNA-Seq
Initiation à Python : 2025
Objectifs pédagogiques
A l’issue de la formation, les stagiaires seront capables de :
maitriser les éléments de base du langage de programmation Python,
les appliquer sur des cas concrets en bioinformatique,
être autonome dans la mise en place de tâches simples d’extraction d’informations, dans le cadre de traitement de données via le langage de programmation Python.
Programme
Présentation de Python
Variables Python
Structures de contrôle
Gestion de fichiers
Réalisation de programmes simples et de Notebooks Jupyter
Mise en pratique avec des exercices de manipulation de fichiers de séquences
EBAII - Ecole de Bioinformatique "Initiation au traitement des données de génomique obtenues par séquençage à haut débit" session 2024
Description : La formation EBAII IFB Aviesan de niveau 1 propose une expérience d'apprentissage intensive conçue pour les biologistes, qu'ils soient ingénieurs, doctorants, chercheurs, enseignants-chercheurs ou praticiens, qui sont confrontés à l'analyse de données NGS (Next-Generation Sequencing) mais qui ne disposent pas encore des compétences bioinformatiques nécessaires, ou qui cherchent à renforcer leurs compétences existantes.
Contenu : Cette formation est structurée autour d'une combinaison de sessions théoriques et d'ateliers pratiques. Les participants auront l'occasion d'explorer diverses thématiques, notamment le traitement de données de variants, ChIP-Seq, Bulk RNA-Seq, et Single-Cell RNA-Seq. De plus, ils recevront une introduction aux technologies "long reads".
Objectifs généraux:
Acquérir une compréhension approfondie des concepts liés à l'analyse de données NGS.
Maîtriser les outils informatiques nécessaires pour effectuer ces analyses.
Interpréter les résultats des analyses de données NGS.
EBAII : Ecole de Bioinformatique "Traitement des données de génomique obtenues par séquençage à haut débit" niveau débutant - session 2025
Description : La formation EBAII IFB Aviesan de niveau 1 propose une expérience d'apprentissage intensive conçue pour les biologistes, qu'ils soient ingénieurs, doctorants, chercheurs, enseignants-chercheurs ou praticiens, qui sont confrontés à l'analyse de données NGS (Next-Generation Sequencing) mais qui ne disposent pas encore des compétences bioinformatiques nécessaires, ou qui cherchent à renforcer leurs compétences existantes.
Contenu : Cette formation est structurée autour d'une combinaison de sessions théoriques et d'ateliers pratiques. Les participants auront l'occasion d'explorer diverses thématiques, notamment le traitement de données de variants, ChIP-Seq, Bulk RNA-Seq, et Single-Cell RNA-Seq. De plus, ils recevront une introduction aux technologies "long reads".
Objectifs généraux:
Acquérir une compréhension approfondie des concepts liés à l'analyse de données NGS.
Maîtriser les outils informatiques nécessaires pour effectuer ces analyses.
Interpréter les résultats des analyses de données NGS.
Introduction aux bonnes pratiques pour des analyses reproductibles : 2025
Objectifs pédagogiques
L’objectif de cette formation est d’initier les apprenants aux bonnes pratiques pour la reproductibilité des analyses. Ils apprendront à rédiger des rapports d’analyse en R Markdown et à les déposer sur un dépôt GitHub. Les principes FAIR (faciles à trouver, accessibles, interopérables et réutilisables) et les bases de la rédaction de PGD (plans de gestion de données) seront également présentés. Durant la formation, nous utiliserons RStudio et GitHub.
Programme
Principes et enjeux de la recherche reproductible
Utilisation de GitHub
Gestion des versions d’un document
Rédaction de document computationnel
Partage d’un rapport avec ses collaborateurs
Principes FAIR et PGD
Analyse statistique de données RNA-Seq - Recherche des régions d’intérêt différentiellement exprimées : 2025
Objectifs pédagogiques
* Se sensibiliser aux concepts et méthodes statistiques pour l’analyse de données transcriptomiques de type RNA-Seq.
* Comprendre le matériel et méthodes (normalisation et tests statistiques) d’un article.
* Réaliser une étude transcriptomique avec R dans l’environnement RStudio.
Programme
* Planification expérimentale des expériences RNA-Seq (identification des biais, répétitions, biais contrôlables).
* Normalisation et analyse différentielle : recherche de “régions d’intérêt” différentiellement exprimées (modèle linéaire généralisé).
*Prise en compte de la multiplicité des tests.
Le cours sera illustré par différents exemples. Un jeu de données à deux facteurs sera analysé avec les packages R DESeq2 et edgeR dans l’environnement RStudio.
Traitement bioinformatique et analyse différentielle de données d’expression RNA-seq sous Galaxy : 2025
Objectifs pédagogiques
A l’issue de cette formation, vous serez capable, dans le cadre d’une analyse de données RNA- seq avec génome de référence et plan d’expérience simple :
* de connaître le vocabulaire et les concepts bioinformatiques et biostatistiques ;
* de savoir enchaîner de façon pertinente un ensemble d’outils bioinformatiques et biostatistiques dans l’environnement Galaxy ;
* de comprendre le matériel et méthodes d’un article du domaine ;
* d’évaluer la pertinence d’une analyse RNA-seq en identifiant les éléments clefs et comprendre les particularités liées à la nature des données.
Programme
Bioinformatique :
* Obtenir des données de qualité : nettoyage, filtrage, qualité
* Aligner les lectures sur un génome de référence
* Détecter de nouveaux transcrits
* Quantifier l’expression des gènes
* Préparer et déployer unensemble d’analyses sur plusieurs échantillons
Biostatistique :
* Construire un plan d’expérience simple
* Normaliser les données de comptage
* Identifier les gènes différentiellements exprimés
* Se sensibiliser aux tests multiples
Analyse de protocoles Bioinformatique et Biostatistiques issus de la littérature
Analyse de données métagénomiques shotgun : 2025
Objectifs pédagogiques
Cette formation est dédiée à l’analyse de données métagénomiques procaryotes de type « shotgun » issues de la technologie de séquençage Illumina. Nous présenterons les étapes bioinformatiques nécessaires pour nettoyer les données brutes et les caractériser d’un point de vue taxonomique. Nous aborderons ensuite les différentes stratégies à employer pour assembler les reads et obtenir des comptages sur des gènes prédits. Enfin nous présenterons quelques outils pour obtenir une annotation fonctionnelle des échantillons. A l’issue des 2 jours de formation, les stagiaires connaîtront le périmètre, les avantages et limites des analyses de données de séquençage shotgun. Ils seront capables d’utiliser les outils présentés sur les jeux de données de la formation. L’ensemble des TP se déroulera sur l’infrastructure de Migale et nécessite une pratique courante de la ligne de commande.
Programme
Introduction générale sur les données métagénomiques
Assignation taxonomique
Nettoyage des données brutes
Assemblage / Binning
Prédiction de gènes procaryotes
Annotation fonctionnelle
Conclusion, limites des méthodes
Analyse de données de métabarcoding : 2025
Cette formation est dédiée à l'analyse de données de type "metabarcoding" issues de la technologie de séquençage Illumina. Nous aborderons les différentes étapes bioinformatiques nécessaires pour transformer les données de séquençage brutes en table d'abondances. Nous présenterons également les outils et méthodologies classiquement utilisés pour décrire la diversité observée et comparer les échantillons.
A l’issue des 4 jours de formation, les stagiaires connaîtront le périmètre, les avantages et limites des analyses de données de séquençage amplicons (métabarcoding).
Ils seront capables d’utiliser les outils de FROGS sur les jeux de données de la formation (16S et ITS).
Ils seront capables d’identifier les outils et méthodes adaptées au cadre de leurs analyses.
S’ils ont en leur possession un jeu de données à analyser, ils sont encouragés à venir avec celui- ci.