Topic outline

  •    


    Description

    Le réseau MétiER en bIoinformaTique (MERIT) et l’Institut Français de Bioinformatique (IFB) organisent une Action Nationale de Formation (ANF) sur les principes FAIR appliqués aux langages de workflows bioinformatiques à destination des bioinformaticien·ne·s. Il s'agit d'une formation avancée et complémentaire de la formation WF4Bioinfo organisée par l'IFB. Cette formation est portée par INS2I (CNRS Sciences Informatiques).

    Public visé 

    Bioinformaticiens souhaitant améliorer la reproductibilité de leur workflow.

    Objectifs pédagogiques

    À la fin de cette formation les participants : 
    • Auront acquis les bases et connaîtront certaines fonctions avancées des gestionnaires de workflows
    • Auront écrit un workflow (proposé par l’équipe pédagogique) en Nextflow et connaîtront les bases pour le transposer en Snakemake 
    • Auront exécuté le workflow sur le cluster mis à disposition par l’IFB et l'auront optimisé par IA

    L'école inclura des sessions mixant théorie (environ 60%) et pratique (environ 40%). Les participants  implémenteront un workflow d'analyse à partir d'un script Bash en respectant les principes FAIR et de reproductibilité. Lors de ce travail, les points suivants seront abordés :

    • Quels principes de reproductibilité appliquer à un workflow ?
    • Utilisations avancées de Nextflow ;
    • Enrichissement du code en métadonnées : lors du versionning et lors du dépôt ;
    • Dépôt sur l'archive de code Software Héritage (SWH) et HAL ;
    • Mise en place d'intégration continue pour garantir la qualité du dépôt du code du workflow ;
    • Apport des outils de l'IA à la création d'un workflow.

    Prérequis

    • Disposer d'un ordinateur portable pendant toute la formation
    • Avoir une bonne maîtrise d'Unix/shell : gestion de fichiers et répertoires, lancement de commandes, scripting 
    • Avoir une bonne maîtrise de Git en ligne de commande (pull, add, commit, push, log, branch, switch, checkout...)
    • Utiliser une plateforme de partage de code comme GitHub, GitLab et savoir créer une branche, évaluer et valider une pull request.
    • Maîtrise d'au moins un outil de workflow (Nextflow ou Snakemake) 
    • Avoir suivi le tutoriel Nextflow : https://training.nextflow.io/latest/ ou pratiquer régulièrement Nextflow

    Durée 

    La formation s'étend sur une période de trois jours, du mardi 25 novembre 2025 à 9h au jeudi 27 novembre à 17h. Un webminaire d'introduction aura lieu deux semaines avant la formation en présentiel.

    Lieu 

    Les cours se dérouleront au CAMPANILE PARIS-SUD - Porte d'Orléans - Arcueil, 73 av. Aristide Briand, 94110 - ARCUEIL 

    Langue

    Tous les cours de cette formation seront dispensés en français, les supports de cours sont en anglais.

    Environnement de Travail

    Les ateliers utiliseront les ressources du cluster de calcul de l'IFB. Il est demandé aux participants de venir avec leur ordinateur portable et un compte sur le cluster de l'IFB (https://my.cluster.france-bioinformatique.fr/manager2/register).

    Nombre de places 

    20

    Frais d'Inscription 

    Les agents CNRS et INRAe bénéficient d'une subvention de leur employeur. Les frais d'inscription s'élèvent à 600 € HT pour les autres participants académiques et EPIC, et à 1800 € HT pour les participants non académiques. Ces frais comprennent l'hébergement et les dîners du mardi et mercredi. Restent à la charge des participants : les frais de transport et les repas du midi qui auront lieu à la cantine du personnel CNRS (tarification locale).

    Modalités d'inscription

    Date limite de pré-inscription : 18 septembre 2025 midi (sélection des participants : mi-septembre/fin septembre 2025). 

    Inscriptions 

    Remplir le formulaire en ligne ici : https://framaforms.org/anfmeritnov2025-1749634467

    Coordination scientifique

    Thomas Denecker (IFB), Laurent Jourdren (IBENS), Claire Toffano-Nioche (I2BC), animateurs du GT "FAIR, reproductibilité et workflows" du réseau MERIT

    Équipe pédagogique

    Contact

    merit-admin-gt-fair@services.cnrs.fr



    Programme détaillé

    Webinaire introductif (13 novembre de 13h30 à 17h)
    Heure TitreIntervenants Support
    13h30-15h00 Présentation des participantsThomas Denecker
     15h00-15h30 Présentation de la formation Laurent Jourdren PDF
     15h45-16h30 Organisation d'un projet dans un contexte géopolitique tendu  Claire Toffano-Nioche PDF

    Mardi 25 novembre
    Heure  Titre Intervenants  Support
    9h00-9h30 👋 Accueil
    9h30-9h45 🌅 Introduction générale  Thomas Denecker, Laurent Jourdren, Claire Toffano-Nioche  PDF
    9h45-10h15  💡 Redéfinition d'un workflow   Laurent Jourdren, Claire Toffano-Nioche  PDF
    10h15-11h15  ⚙️ Présentation de l'exemple appliqué "fil rouge" de la formation  Thomas Denecker, Laurent Jourdren, Claire Toffano-Nioche  PDF
    11h15-11h30  ☕️ 🥐    
    11h30-12h30  💡Introduction à la reproductibilité au sens large  Sarah Cohen-Boulakia  PDF
    12h30-14h00  🍽️    
    14h00-14h45  💡 Quelles différences entre Conda/Pixi, les containers, Spack et Guix ?  Gildas Le Corguillé , Julien Seiler  Intro managers 
     conda pixi
    14h45-16h00   ⚙️ Création d'un environnement "conda/Pixi" et packaging d'un outil  Gildas Le Corguillé , Julien Seiler  build_conda_pkg
    16h00-17h00 ⚙️ Enrichissement d'une image d'un container avec cet environnement pour faire tourner le script   Laurent Jourdren, Imane Messak & Baptiste Rousseau  GitLab
    17h00-17h15   ☕️ 🥐    
    17h15-18h00  💡 Pourquoi utiliser un gestionnaire de workflow, Comparaison Snakemake / Nextflow   Frédéric Lemoine  
    18h00-18h30   💡 Galaxy: souvent oublié et pourtant !  Gildas Le Corguillé  Slides Tutorial
    19h00-20h30  🍽️    

    Mercredi 26 novembre


    Heure 
    Titre Intervenants  Support
    8h30-9h30 💡 Introduction Nextflow (Seqera / nf-core / Nextflow) Maxime Garcia  PDF
    9h30-10h30 💡Données de référence Maxime Garcia  PDF
    10h30-11h00 ⚙️ Utilisation données distantes  Maxime Garcia  PDF
    11h00-11h20  ☕️ 🥐  
    11h20-11h50  ⚙️ Flux conditionnel  Maxime Garcia  PDF
    11h50-12h50  ⚙️ Exploiter la puissance HPC, quelles interconnexions entre le workflow et le gestionnaire de tâche du cluster   Maxime Garcia, Gildas Le Corguillé, Julien Seiler   GitLab
    13h00-14h00  🍽️    
    14h00-15h00  ⚙️ Création d'un module, tests  Maxime Garcia  PDF
    15h00-15h45  ⚙️ Création d'un module, dépôt sur nf-core   Maxime Garcia  
    15h45-16h05  ☕️ 🥐    
    16h05-16h35  ⚙️ l'IA avec Nextflow  Maxime Garcia  PDF
    16h35-17h20  💡 Passage du dev à la prod    Maxime Garcia  PDF
    17h20-18h20  ⚙️ Concepts workflow avancés : reporting  Maxime Garcia  PDF
    19h00-20h00   🍽️    

    Jeudi 27 novembre




    Heure 
    Titre Intervenants  Support
    8h30-9h15 ⚙️ Traduction des développements Nextflow avancés en Snakemake Claire Toffano-Nioche  PDF demo_report
    9h30-10h30 💡Enrichir le code en métadonnées pour le rendre plus FAIR Alban Gaignard  PDF
    10h30-10h45 ☕️ 🥐  
    10h45-11h45  💡Comment les entrepôts permettent d'améliorer la FAIRness des workflows  Alban Gaignard  PDF
    11h45-12h45  ⚙️ Partage : Archiver son code dans Software Heritage, le diffuser dans HAL  Pierre Poulain  PDF
    12h45-14h00  🍽️     
    14h00-15h00  ⚙️ Rendre plus FAIR son dépôt GitLab  Thomas Denecker, Imane Messak & Baptiste Rousseau  PDF GitLab
    15h00-15h15  ☕️ 🥐
     
    15h15-15h45   ✍️ Questionnaire de satisfaction     
    15h45-16h30  💡Conclusion  Thomas Denecker, Laurent Jourdren & Claire Toffano-Nioche  PDF
    16h30-17h00 🔥 Retour à chaud
       
    17h00  👋 Fin de la formation