Topic outline
-
L’Institut Français de Bioinformatique (IFB) organise en partenariat avec iPOP-UP (représenté par EDC) une formation sur les langages de workflows en bioinformatique à destination des bioinformaticien·ne·s et des bioanalystes. La formation abordera les fondamentaux et les fonctionnalités avancées des deux langages Snakemake et Nextflow. Ces outils sont en effet devenus indispensables pour assurer la reproductibilité et l’efficacité des analyses bioinformatiques. La formation sera structurée en trois séquences :
- une journée commune qui abordera les grands principes des gestionnaires de workflow, en particulier dans le domaine de la bioinformatique et en lien avec les infrastructures de calcul de type cluster et cloud proposés au sein de l’IFB
- une journée de session pratique avec 1 atelier snakemake (v.8) et 1 atelier nextflow (DSL2) en parallèle au choix des participants. Nous proposons aux participants qui le souhaitent de travailler sur leur propre workflow dans une approche “Bring your own script” avec l’aide de l’équipe pédagogique.
- une demi-journée "Bring your own script".
Objectifs pédagogiques
A la fin de cette formation les participants :
- auront acquis les bases et connaîtront les fonctions avancées des gestionnaires de workflows
- auront écrit et/ou converti un workflow d’analyse (apporté par le participant ou proposé par l’équipe pédagogique) dans le langage de leur choix (Snakemake v.8, Nextflow DSL2)
- auront exécuté et optimisé leur workflow sur le cluster ou le cloud mis à disposition par l’IFB
Pré-requis
- Maîtrise d’unix et d’un langage de ligne commande (bash ou équivalent)
- Avoir déjà exécuté au moins une analyse avec un gestionnaire de workflow (Snakemake, Nextflow ou équivalent) sans avoir obligatoirement développé le workflow
- Savoir travailler dans un environnement de type cluster et/ou cloud
Modalités
La formation aura lieu du lundi 14 octobre - 13h00 au mercredi 16 octobre 2024 - 12h30 en présentiel à Paris (CNRS Délégation Villejuif).
Adresse : CNRS Délégation Ile-de-France Villejuif, 7 Rue Guy Môquet, 94800 Villejuif.
Métros : Villejuif Paul Vaillant-Couturier (M7).
Les participants devront se munir de leur ordinateur portable.
Inscriptions closes.
Tarifs
- Académique : 250 €
- Non-académique : 1000 €
Ces tarifs incluent le repas du midi du jour 2 (plateaux repas) et les pauses café du matin et de l'après-midi
Equipe pédagogique
- Sébastien RAVEL CIRAD - PHIM - South Green
- Cédric Midoux MaIAGE - INRAE
- Salomé Brunon GenomiqueENS - IBENS
- Julien Roméjon Institut Curie
- Frédéric Jarlier Institut Curie
- Philippe Hupé Institut Curie
- Chloé Quignot BIOI2 - I2BC / CEA / Paris-Saclay
- Pauline Lasserre-Zuber GDEC - UMR INRAE/UCA
Equipe organisatrice
- IFB: H. Chiapello, L. Jourdren, L. Khamvongsa-Charbonnier
- iPOP-UP représenté par l'unité Epigénétique et Destin Cellulaire: M. Hennion
-
Forum
- une journée commune qui abordera les grands principes des gestionnaires de workflow, en particulier dans le domaine de la bioinformatique et en lien avec les infrastructures de calcul de type cluster et cloud proposés au sein de l’IFB
-
Lundi 14 octobre 2024 - Bat L salle de conférence 13h30-14h00 Introduction, présentation des intervenants et formateurs 14h00-15h30 Présentation de l'IFB
Présentation des bonnes pratiques en bioinformatique
Présentation des containers15h30-16h00 pause 16h00-17h30 Les clusters de calculs et schedulers
Accéder au cluster IFB (Open OnDemand, slurm)
Mardi 15 octobre 2024 - Bat B (2ème étage NF et 3ème étage Smk) 9h00-10h30 Présentation des gestionnaires de workflows SnakeMake et Nextflow 10h30-11h00 pause 11h00-12h30 Ateliers en parallèle sur des workflows fournis par l'équipe pédagogique
Atelier 1 : Snakemake
Atelier 2 : Nextflow12h30-14h00 Déjeuner 14h00-15h30 Ateliers en parallèle sur des workflows fournis par l'équipe pédagogique
Atelier 1 : Snakemake
Atelier 2 : Nextflow15h30-16h00 pause 16h00-16h45 En pleinière : bilan des ateliers et comparaison des langages SnakeMake et NextFlow 16h45-17h30 Présentation flash des scripts des participants pour atelliers du mercredi
Mercredi 16 octobre 2024 - bat B salles E04 et E05 (sous-sol) 9h00-9h15 Mise en place des ateliers et sous-groupes 9h15-10h30 Travail en sous-groupes sur les workflows d'analyse des participants 10h30-11h00 pause 11h00-12h15 Travail en sous-groupes sur les workflows d'analyse des participants 12h15-12h30 Bilan flash par sous-groupes du travail 12h30 Questionnaire final -
-
We will begin with a presentation of the Institut Français de Bioinformatique (IFB) and the resources available to the community. We will then move on to a reminder of best practices for adhering to the FAIR principles and explore how the use of workflow languages and controlled environments aligns with this approach
-
Introduction to IFB core cluster.
We'll begin with an introduction to the cluster and the Open OnDemand graphical interface, getting hands-on experience with it. Following that, we'll cover an introduction to the Slurm scheduler, including a practical session to familiarize ourselves with the most commonly used commands.
-
-
-
Brief introduction to both workflow systems with a short practical session to learn how to run an already-existing pipeline in each language.
-
A remplir pour la session des présentations des scripts de 16h45-17h30.
-
-
-
-
-
In this session, you will follow a guided exercise at your own pace in order to construct a Snakemake pipeline from scratch. This exercise is cut into several parts:
- part A: basic snakemake pipeline
- part B: add extra features
- part C: adapt your pipeline to an HPC environment
- part D: description of a few extra features to bring home
There will also be a quick presentation of a use case with Snakemake.
-