Aperçu des sections
-
Description
Le réseau MétiER en bIoinformaTique (MERIT) et l’Institut Français de Bioinformatique (IFB) organisent une Action Nationale de Formation (ANF) sur les principes FAIR appliqués aux langages de workflows bioinformatiques à destination des bioinformaticien·ne·s. Il s'agit d'une formation avancée et complémentaire de la formation WF4Bioinfo organisée par l'IFB.Public visé
Bioinformaticiens souhaitant améliorer la reproductibilité de leur workflow.Objectifs pédagogiques
À la fin de cette formation les participants :- Auront acquis les bases et connaîtront certaines fonctions avancées des gestionnaires de workflows
- Auront écrit un workflow (proposé par l’équipe pédagogique) en Nextflow et connaîtront les bases pour le transposer en Snakemake
- Auront exécuté le workflow sur le cluster mis à disposition par l’IFB et l'auront optimisé par IA
L'école inclura des sessions mixant théorie (environ 60%) et pratique (environ 40%). Les participants implémenteront un workflow d'analyse à partir d'un script Bash en respectant les principes FAIR et de reproductibilité. Lors de ce travail, les points suivants seront abordés :- Quels principes de reproductibilité appliquer à un workflow ?
- Utilisations avancées de Nextflow ;
- Enrichissement du code en métadonnées : lors du versionning et lors du dépôt ;
- Dépôt sur l'archive de code Software Héritage (SWH) et HAL ;
- Mise en place d'intégration continue pour garantir la qualité du dépôt du code du workflow ;
- Apport des outils de l'IA à la création d'un workflow.
Prérequis
- Disposer d'un ordinateur portable pendant toute la formation
- Avoir une bonne maîtrise d'Unix/shell : gestion de fichiers et répertoires, lancement de commandes, scripting
- Avoir une bonne maîtrise de Git en ligne de commande (pull, add, commit, push, log, branch, switch, checkout...)
- Utiliser une plateforme de partage de code comme GitHub, GitLab et savoir créer une branche, évaluer et valider une pull request.
- Maîtrise d'au moins un outil de workflow (Nextflow ou Snakemake)
- Avoir suivi le tutoriel Nextflow : https://training.nextflow.io/latest/ ou pratiquer régulièrement Nextflow
Durée
La formation s'étend sur une période de trois jours, du mardi 25 novembre 2025 à 9h au jeudi 27 novembre à 17h. Un webminaire d'introduction aura lieu deux semaines avant la formation en présentiel.Inscriptions : https://framaforms.org/anfmeritnov2025-1749634467
Lieu
Les cours se dérouleront au centre CNRS de Villejuif. 7 rue Guy Môquet 94800 - Villejuif
Langue
Tous les cours de cette formation seront dispensés en français, les supports de cours sont en anglais.Environnement de Travail
Les ateliers utiliseront les ressources du cluster de calcul de l'IFB. Il est demandé aux participants de venir avec leur ordinateur portable et un compte sur le cluster de l'IFB (https://my.cluster.france-bioinformatique.fr/manager2/register).Nombre de places
20
Frais d'Inscription
Les agents CNRS et INRAe bénéficient d'une subvention de leur employeur. Les frais d'inscription s'élèvent à 600 € HT pour les autres participants académiques et EPIC, et à 1800 € HT pour les participants non académiques. Ces frais comprennent l'hébergement et les dîners du mardi et mercredi. Restent à la charge des participants : les frais de transport et les repas du midi qui auront lieu à la cantine du personnel CNRS (tarification locale).Modalités d'inscription
Date limite de pré-inscription : 15 septembre 2025 (sélection des participants : mi-septembre/fin septembre 2025).Inscriptions
Remplir le formulaire en ligne ici : https://framaforms.org/anfmeritnov2025-1749634467Coordination scientifique
Thomas Denecker (IFB), Laurent Jourdren (IBENS), Claire Toffano-Nioche (I2BC), animateurs du GT "FAIR, reproductibilité et workflows" du réseau MERITÉquipe pédagogique
- Hélène Chiapello, IFB/MERIT, (organisatrice) https://cv.hal.science/helene-chiapello
- Vincent Lefort, MERIT (organisateur) https://orcid.org/0000-0003-2864-4783
- Thomas Denecker, IFB, (organisateur) https://orcid.org/0000-0003-1421-7641
- Laurent Jourdren, IBENS, (organisateur) https://orcid.org/0000-0003-4253-1048
- Claire Toffano-Nioche, I2BC, (organisatrice) https://cv.hal.science/claire-toffano-nioche
- Sarah Cohen Boulakia, U-Paris-Saclay (formatrice) https://sarah.cohen-boulakia.eu/
- Alban Gaignard, IFB, Bird (formateur) https://albangaignard.github.io/
- Maxime Garcia, Seqera (formateur) https://maxulysse.github.io/about.html
- Céline Hernandez, I2BC (helper) https://cv.hal.science/celine-hernandez
- Gildas Le Corguillé, IFB, Station Biologique de Roscoff, Sorbonne Université/CNRS SBR (formateur) https://github.com/lecorguille
- Frédéric Lemoine, Pasteur (formateur) https://research.pasteur.fr/fr/member/frederic-lemoine/
- Imane Messak, IFB (helper) https://orcid.org/0000-0002-1654-6652
- Pierre Poulain, U-Paris-Cité (formateur) https://orcid.org/0000-0003-4177-3619
- Baptiste Rousseau, IFB (helper) https://orcid.org/0009-0002-1723-2732
- Julien Seiler, IFB (formateur à confirmer) https://orcid.org/0000-0002-4549-5188
- Jacques Van Helden, Aix-Marseille Univ. (formateur) https://orcid.org/0000-0002-8799-8584
Contact
merit-admin-gt-fair@services.cnrs.fr
Programme détaillé
Webinaire introductif (13 novembre de 13h30 à 17h)
- Présentation de la formation
- Présentation des participants
- Organisation d'un projet dans un contexte géopolitique tendu
Mardi 25 novembre
- Introduction à la reproductibilité
- Redéfinition d'un workflow
- Présentation de l'exemple appliqué "fil rouge" de la formation
- Quelle est la différence entre Conda/Pixi, les containers, Spack et Guix ?
- Création d'un environnement Conda/Pixi et son packaging
- Enrichissement d'une image d'un container avec cet environnement pour faire tourner le script
- Pourquoi utiliser un gestionnaire de workflow, Comparaison Snakemake / Nextflow
Mercredi 26 novembre
- Introduction à Nextflow
- Concept workflow avancé : Données de référence
- Concept workflow avancé : Utilisation données distantes
- Concept workflow avancé : Flux conditionnel avec Nextflow
- Concept workflow avancé : Passer du développement à la production
- Exploiter la puissance HPC, quelles interconnexions entre le workflow et le gestionnaire de tâche du cluster
- Concept workflow avancé : reporting
- l'IA avec Nextflow
- Création d'un module, Test et dépôt sur nf-core
Jeudi 27 novembre
- Traduction des développements Nextflow avancés en Snakemake
- Enrichir le code en métadonnées pour le rendre plus FAIR
- Comment les entrepôts permettent d'améliorer la FAIRness des workflows
- Partage : Archiver son code dans Software Heritage, le diffuser dans HAL
- Mise en place de CI pour Gitlab
- Quid de la reproductibilité avec l'IA à l'heure actuelle
- Conclusion
-
Forum