RNASeq analyses (using Galaxy and TOGGLe)
This course offers an introduction to RNASeq analyses using two different workflow management systems: Galaxy and TOGGLe. This includes reference-based mapping, estimates of transcript levels, differential expression (DE) analyses, visualization of statistics results.
Prerequisites
Workflow management system (Galaxy, TOGGLe)
Program
Mapping of RNASeq against a transcriptome reference with kallisto (Galaxy)
Mapping of RNASeq against an annotated genome reference with TopHat (TOGGLe)
Differential expression analysis using EdgeR and DESeq2
Plots, clustering, co-expression network: degust, WGCNA
Learning objectives
Manipulate packages/tools available for searching DE genes
Think about different normalisation methods
Detect differentially expressed genes
Compare results between two approaches
Instructors
Alexis Dereeper - alexis.dereeper@ird.fr
Sebastien Cunnac - sebastien.cunnac@ird.fr
Sebastien Ravel - sebastien.ravel@cirad.fr
Christine Tranchant - christine.tranchant@ird.fr
Assemblage de transcriptome
Assemblage de novo des transcrits avec Trinity...
Linux For Jedi - April 2022
This course offers to develop and enhance advanced Linux shell command line and scripting skills for the processing and analysis of NGS data. We will work on a HPC server and use linux powerful commands to allow to analyze big amount of biological data.
Introduction to python - May 2022
This course provides an introduction to programming using python. At the end of the training, participants should be able to write simple python programs to handle biological data and to understand more complex programs written by others.
Note : This course in currently available only in french
This course offers an introduction to work with Linux. We will describe the Linux environment, the first linux commands so participants can start to utilize command-line tools and feel comfortable using bioinformatics softwares through a linux terminal.
Prerequisites
No experience required
Program
Connecting to a distant HPC
Navigating through a Unix file system
Creating and deleting files
Manipuling and filtering file text
Basics searching for text within a file
Learning objectives
After this course, participants should be able to:
Connect to a Unix / Linux system
Manipulate files and directories within the Linux system
Work with text files
Run programs from the command-line
Instructors
Christine Tranchant - christine.tranchant@ird.fr
Ndomassi Tando - ndomassi.tando@ird.fr
Bruno Granouillac - bruno.granouillac@ird.fr
François Sabot - francois.sabot@ird.fr
Gautier Sarah - gautier.sarah@cirad.fr
This course offers to develop and enhance advanced Linux shell command line and scripting skills for the processing and analysis of NGS data. We will work on a HPC server and use linux powerful commands to allow to analyze big amount of biological data.
Prerequisites
Basic knowledge of Linux (Linux for dummies required)
Program
Connecting to a distant HPC
Manipuling text files
Complex searching for text in a file
Combining several commands
Writing simple shell scripts
Learning objectives
After this course, participants should be able to:
Manipulate and search within text files
Chain and combine commands
Perform the same actions on many files
Write a simple shell script
Instructors
Christine Tranchant (CT) - christine.tranchant@ird.fr
Ndomassi Tando (NT) - ndomassi.tando@ird.fr
Bruno Granouillac (BG) - bruno.granouillac@ird.fr
François Sabot (SB) - francois.sabot@ird.fr
Gautier Sarah (GS) - gautier.sarah@cirad.fr
Linux for Dummies - April 2022
This course offers an introduction to work with Linux. We will describe the Linux environment, the first linux commands so participants can start to utilize command-line tools and feel comfortable using bioinformatics softwares through a linux terminal
This course offers an introduction to work with Linux. We will describe the Linux environment, the first linux commands so participants can start to utilize command-line tools and feel comfortable using bioinformatics softwares through a linux terminal
Introduction to python 2023
This course provides an introduction to programming using python. At the end of the training, participants should be able to write simple python programs to handle biological data and to understand more complex programs written by others.
Note : This course in currently available only in french
Advanced HPC Trainings 2023
This course continues the explanation on how to work on HPC Southgreen clusters. It is intended for experienced users, with the goals of improving LC user productivity and minimizing the obstacles. New notions and tools are presented such as job arrays, basic softwares installation,module environment and singularity. All these notions will be developped.
Introduction to Microbial Comparative Genomics 2023
This course offers an introduction to microbial genomics analysis.
It includes 5 issues: assembly, genome annotation, circos visualization, pan-genome construction, pan-GWAS.
This course offers to develop and enhance advanced Linux shell command line and scripting skills for the processing and analysis of NGS data. We will work on a HPC server and use linux powerful commands to allow to analyze big amount of biological data.
Introduction to Microbial Comparative Genomics 2022
This course offers an introduction to microbial genomics analysis.
It includes 5 issues: assembly, genome annotation, circos visualization, pan-genome construction, pan-GWAS.
Initiation to NGS Workflow Managers developed within the South Green Platform: Galaxy and TOGGLe
This course introduces the 2 commonly used workflow managers in the South Green Bioformatics platform, both in a theoretical and practical way, with hands-on practice sessions. It will help you to quickly develop and run your own pipelines using these tools through an graphical user or command-line interface.
Prerequisites
Prior knowledge of workflow managers not necessary Basic knowledge of Linux (Linux for dummies required) - TOGGLe practical
Program
Why using a workflow manager to analyse data ?
How to perform an analysis ?
How to create your own workflow ?
How to execute it?
Use case
Learning objectives
Explaining what Workflow Managers are,
in which way they differ from each other.
How you can use them in your research.
Creating your own workflow
Analysing your NGS data with Galaxy and TOGGLe
Instructors
Alexis Dereeper (AD) - alexis.dereeper@ird.fr
Sebastien Ravel (SR) - sebastien.ravel@cirad.fr
Christine Tranchant (CT) - christine.tranchant@ird.fr
Introduction to Oxford Nanopore Technology data analyses 2023
This course offers an introduction to ONT data analysis. It includes 5 issues: basecalling, reads quality control, assemblies and polishing/correction, contig quality and structural variants detection.
Introduction to RNA-Seq analysis
Introduction to High-performance computing
This course offers an introduction on how to work with HPC Southgreen clusters. It is intended for new users, with the goals of improving user productivity and minimizing the obstacles. The HPC Southgreen cluster are presented, together with the tools to be able to use it. Module load notion, interactive usage and batch jobs submittions will be developped.
Prerequisites
Linux Basics
Program
Introduction to HPCs architecture
Discover Sun grid Engine (SGE)
Data Management on clusters
Interactive Usage
Submit batch jobs
Learning objectives
After this course, participants should be able to:
Use the HPC resources interactively
Manage data copies
Use module load
submit batch jobs
Instructors
Ndomassi Tando (NT) - ndomassi.tando@ird.fr
Bertrand Pitollat(BP) - bertrand.pitollat@cirad.fr
Alexis Dereeper (AD) - alexis.dereeper@ird.fr
Introduction to Structural variant detection analyses 2022
Program
* Handling mapping tools suitable for ILLUMINA and ONT data (bwa, minimap2)
* SNP detection from mapping of short reads against a reference genome: SNP calling, filters and SNP annotation. Examples of possible studies based on SNP arrays
* Detecting Structural Variations (SV) in short and long reads (breakdancer, sniffle)
* SV detection from genome assembly and comparison (minimap2, nucmer, assemblytics, siry)
Advanced HPC Trainings 2022
This course continues the explanation on how to work on HPC Southgreen clusters. It is intended for experienced users, with the goals of improving LC user productivity and minimizing the obstacles. New notions and tools are presented such as job arrays, basic softwares installation,module environment and singularity. All these notions will be developped.
Metabarcoding analyses 2022
This course offers an introduction to metabarcoding analyses at two different levels/steps: bioinformatics with FROGS pipeline in the Galaxy environment, biostatistics with PhyloSeq R package. This includes preprocessing, clustering and OTU picking, taxonomic assignation, estimation of diversity, visualization of statistics results.
Prerequisites
Galaxy, R knowledge
Program
Introduction to metagenomics and metabarcoding
Pre-processing, Clustering, taxonomic affiliation (FROGS)
Handling and visualizing OTU table using PhyloSeq R package (PhyloSeq)
Learning objectives
Manipulate tools available for metabarcoding analysis
Study sample diversity by using NGS and post-NGS analysis tools
Visualize diversity metrics in metabarcoding approach
Instructors
Julie Orjuela - julie.orjuela@ird.fr
Florentin Constancias - florentin.constancias@cirad.fr
Alexis Dereeper - alexis.dereeper@ird.fr
Reproducible Research 2023
The following topics and tools are covered in the course:
Data management
Project organisation
Git
Conda
Snakemake
Nextflow
R Markdown
Jupyter
Docker
Singularity
At the end of the course, students should be able to:
Use good practices for data analysis and management
Clearly organise their bioinformatic projects
Use the version control system Git to track and collaborate on code
Use the package and environment manager Conda
Use and develop workflows with Snakemake and Nextflow
Use R Markdown and Jupyter Notebooks to document and generate automated reports for their analyses
Use Docker and Singularity to distribute containerized computational environments
Analyse de données NGS dédiée à la génomique végétale en Afrique de l'Ouest
Les avancées spectaculaires des technologies de séquençage de 2ème et 3ème génération sont une véritable révolution pour la recherche en science de la vie. Ces techniques permettent le séquençage en quelques semaines de génomes entiers d’organismes complexes, générant une explosion du volume de données génomiques.
Toutefois l’analyse de telles masses d’informations nécessite des compétences en linux, en bioinformatique ainsi qu’une bonne connaissance et maîtrise de nombreux algorithmes et logiciels. La réalisation de ces analyses nécessite également l’accès à des ressources de calcul telles que des clusters de calcul.
Le DP IAVAO et le LMI LAPSE en collaboration avec la plateforme bioinformatique South Green organisent, du 4 au 12 Octobre 2018, une formation en bioinformatique dédié à l’analyse de données de séquençage dont les objectifs sont de présenter les technologies de séquençage et les différentes analyses bioinformatiques pour exploiter au mieux cette masse de données afin de pouvoir réaliser des projets génomiques à grande échelle sur leurs modèles (plantes et pathogènes).
Prérequis
Aucun
Programme
Linux et lignes de commandes
Initiation à l’utilisation du cluster du CERAAS
Présentation des technologies de séquençages
Appel de SNP sur des données WGS
Post analyse de données de SNPs
Outils Genome Harvest
Objectifs
Après la formation, les participants seront capables de :
se connecter à un cluster Linux
lancer des programmes/analyses bioinformatiques
définir les étapes pour analyser des données de séquençage
analyser des données de séquençage
utiliser des gestionnaires de workflow tel que Galaxy ou TOGGLe
Instructors
Christine Tranchant (CT) - christine.tranchant@ird.fr
Ndomassi Tando (NT) - ndomassi.tando@ird.fr
Bertrand Pitollat (BP) - bertrand.pitollat@cirad.fr
François Sabot (SB) - francois.sabot@ird.fr
Manuel Ruiz (MR) - manuel.ruiz@cirad.fr
Gautier Sarah (GS) - gautier.sarah@cirad.fr
Metabarcoding analyses (using FROGS in Galaxy and Phyloseq)
This course offers an introduction to metabarcoding analyses at two different levels/steps: bioinformatics with FROGS pipeline in the Galaxy environment, biostatistics with PhyloSeq R package. This includes preprocessing, clustering and OTU picking, taxonomic assignation, estimation of diversity, visualization of statistics results.
Prerequisites
Galaxy, R knowledge
Program
Introduction to metagenomics and metabarcoding
Pre-processing, Clustering, taxonomic affiliation (FROGS)
Handling and visualizing OTU table using PhyloSeq R package (PhyloSeq)
Learning objectives
Manipulate tools available for metabarcoding analysis
Study sample diversity by using NGS and post-NGS analysis tools
Visualize diversity metrics in metabarcoding approach
Instructors
Julie Orjuela - julie.orjuela@ird.fr
Florentin Constancias - florentin.constancias@cirad.fr
Alexis Dereeper - alexis.dereeper@ird.fr
BIGomics, Génomique Comparative Biopolis
Ce module vise à fournir une expérience d’analyse de données de génomique.
Les technologies Next Generation Sequencing (NGS) ont conduit à une production massive de
données « Omiques » pour les plantes cultivées majeures, ce qui demande de nouvelles
approches d’analyses haut débit. La connaissance de ces approches et des outils qui en
découlent pour analyser la séquence et la structure des génomes, les annoter et caractériser
leur diversité et leurs profils d’expression permet d’aborder des questions de recherche
biologique avancée sur la diversité et l’adaptation des plantes. Les espèces prises en
considération sont des espèces phares des instituts de recherche agronomique de Montpellier
et font partie des cultures les plus importantes pour l’agriculture mondiale. Des plateformes
d’outils bioinformatiques récents reposant sur des centres de calcul et de stockage haute
capacité, sont en place pour analyser des jeux de données originales permettant de mieux
comprendre comment les génomes de plantes évoluent et s’expriment. L’ensemble de ces
connaissances Findable, Accessible, Interoperable, Reusable car intégré dans des systèmes
d’information peut soutenir l'identification de gènes responsables de caractères adaptatifs ou
de production. La mobilisation de jeunes chercheurs sur ces sujets est primordiale tant la
demande est importante.
Le module est structuré sous la forme de cours et de travaux tutorés avec la rencontre de
généticiens et de bioinformaticiens permettant d’appréhender les formes variées des progrès
en bioanalyse génomique. Il permet d’acquérir les lignes directrices pour l’accès, l'utilisation
et l'analyse de différents types de données omique (e.g. (épi)génomique, transcriptomique,
protéique, métabolique) en vue d’accélérer les recherches en génomique fonctionnelle et
biotechnologie des plantes.
L’évaluation sera faite sur la base de la participation et de la qualité du projet proposé par
l’étudiant en fin de module, individuellement ou en binôme, suivant les consignes détaillées en
début de module
BIGomics, Génomique Comparative
Ce module vise à fournir une expérience d’analyse de données de génomique.
Les technologies Next Generation Sequencing (NGS) ont conduit à une production massive de
données « Omiques » pour les plantes cultivées majeures, ce qui demande de nouvelles
approches d’analyses haut débit. La connaissance de ces approches et des outils qui en
découlent pour analyser la séquence et la structure des génomes, les annoter et caractériser
leur diversité et leurs profils d’expression permet d’aborder des questions de recherche
biologique avancée sur la diversité et l’adaptation des plantes. Les espèces prises en
considération sont des espèces phares des instituts de recherche agronomique de Montpellier
et font partie des cultures les plus importantes pour l’agriculture mondiale. Des plateformes
d’outils bioinformatiques récents reposant sur des centres de calcul et de stockage haute
capacité, sont en place pour analyser des jeux de données originales permettant de mieux
comprendre comment les génomes de plantes évoluent et s’expriment. L’ensemble de ces
connaissances Findable, Accessible, Interoperable, Reusable car intégré dans des systèmes
d’information peut soutenir l'identification de gènes responsables de caractères adaptatifs ou
de production. La mobilisation de jeunes chercheurs sur ces sujets est primordiale tant la
demande est importante.
Le module est structuré sous la forme de cours et de travaux tutorés avec la rencontre de
généticiens et de bioinformaticiens permettant d’appréhender les formes variées des progrès
en bioanalyse génomique. Il permet d’acquérir les lignes directrices pour l’accès, l'utilisation
et l'analyse de différents types de données omique (e.g. (épi)génomique, transcriptomique,
protéique, métabolique) en vue d’accélérer les recherches en génomique fonctionnelle et
biotechnologie des plantes.
L’évaluation sera faite sur la base de la participation et de la qualité du projet proposé par
l’étudiant en fin de module, individuellement ou en binôme, suivant les consignes détaillées en
début de module