Topic outline

  • Description de la formation

    L’Institut Français de Bioinformatique (IFB) organise en partenariat avec l’Institut de Biologie Intégrative de la Cellule (I2BC) une formation à destination prioritairement des bioinformaticiens et biostatisticiens des plateformes et équipes membres ou associées de l’IFB et futurs formateurs souhaitant

    • acquérir des compétences théoriques et pratiques sur les principes “FAIR” (Facile à trouver, Accessible, Interopérable, Réutilisable) appliqués à un projet d’analyse et/ou de développement 
    • contribuer à enrichir le matériel pédagogique afin en particulier de l’adapter aux besoins des utilisateurs et communautés de sa plateforme/équipe

     Les concepts FAIR, initialement définis dans le contexte d’ouverture des données de la recherche, seront ici adaptés pour cadrer avec un projet type de développement et/ou analyse bioinformatique/biostatistique. Ainsi, la formation n’abordera pas les aspects “FAIR” spécifiques aux données mais introduira plusieurs outils permettant d’améliorer la reproductibilité des analyses.

    Objectifs pédagogiques

    A la fin de cette formation, les participants pourront mettre en oeuvre les principes de la science reproductible : encapsuler un environnement de travail, concevoir et exécuter des workflows, gérer des versions de code, passer à l’échelle sur un cluster de calcul, gérer des environnements logiciels et assurer la traçabilité de leur analyse à l’aide de Notebooks.

    Modalités

    La formation s’organise en deux séquences :

    • Premier et deuxième jours : formation théorique et pratique aux outils de la science reproductible dans un projet de bioinformatique

    • Troisième jour : atelier optionnel de travail sur le matériel pédagogique de la formation à destination de futurs formateurs 

    La formation aura lieu du lundi 9 octobre au mercredi 11 octobre 2023  en présentiel à Paris (Institut des Systèmes Complexes). Cependant, en fonction de l’évolution des conditions sanitaires, nous pourrons être amenés à basculer une partie ou la totalité de la formation à distance.

    Adresse : Institut des Systèmes Complexes Paris Île-de-France, 113 rue Nationale, 75013, Paris, France. Interphone : Sonner à  “isc-accueil”.

    Métros : Olympiades (M14) and Nationale (M6) Station Vélib : place Nationale.

    Prérequis

    Linux, programmation shell, notions de R

    Tarifs

    • Académique : 250 € pour 2 jours et 375 € pour 3 jours
    • Non-académique : 1000 € pour 2 jours ou 1500 € pour 3 jours

    Ces tarifs incluent les repas du midi (plateaux repas) et les pauses café du matin et de l'après-midi

    Vous devrez vous munir de votre ordinateur portable avec installation préalable de docker pour pouvoir participer à la formation

    Equipe pédagogique

    • IFB : Thomas Denecker, Hélène Chiapello, Gildas Le Corguillé, Julien Seiler, Lucie Khamongsa-Charbonnier (helper) 
    • I2BC : Céline Hernandez, Claire Toffano-Nioche, Emilie Drouineau (helper)


  • A faire avant la formation

    Nous vous demandons de suivre avant la formation un webinaire introductif aux concepts fondamentaux de la reproductibilité qui seront abordés lors de la formation :



  • Programme et liens vers supports




    Contenu

    Horaires

    Intervenant

    Support de cours

    Lundi 9 octobre (accueil à partir de 9h)

    Présentation de la formation - Retour sur le webinaire 

    9:30-10:30

    Hélène & Claire

    PDF

    Usecase 1 -  e-labbook

    Intro au usecase

    10:30-10:45

    Thomas


    Organiser son projet

    10:45-11:15

    Hélène & Thomas

    PDF

    Notebooks

    11:15-12:15

    Thomas

    PDF

    Pause déjeuner 

    Versionning de code (Git) 

    13:15-13:45 

    Claire

    git.html
    git-cheat-sheet

    TP Git

    13:45-14:45

    Claire

    git.ipynb

    Usecase 2 - Développement (en local, collaborer) 

    Intro au usecase

    15:15-15:30 

    Claire

    PDF

    Premiers pas vers un environnement contrôlé : Conda

    15:30-16:00 

    Claire

    conda.html
    Collaborer et partager son travail : les forges logicielles

    16:00-17:30

    Céline & Thomas PDF (Partie 1)
    PDF (Partie 2)

    Mardi 10 octobre

    Distribuer son code et l’environnement (Docker, Singularity)

    9:30-11:30

    Céline

    PDF
    TP

    Usecase 3 - cluster 

    Intro au usecase

    11:45-12:00

    Gildas, Julien

    Cluster de calcul de l’IFB (Jupyterlab, slurm) partie 1

    12:00-12:45

    Julien, Gildas

    Diapos

    Pause déjeuner

    Cluster de calcul de l’IFB (Jupyterlab, slurm) partie 2

    13h45-14:30

    Julien, Gildas

    Diapos

    Workflow (Snakemake)

    14:30-15:45

    Claire

    smk.ipynb
    smk.html

    TP Snakemake (Singularity)

    16:00-17:00

    Julien, Gildas

    Conclusion - questionnaires évaluation

    17:00-17:30

    Claire, Céline

    conclusion
    questionnaire_eval

    Mercredi 11 octobre

    Bilan des évaluations des participants et discussions sur les points d'amélioration

    9:30-10:30

    Hélène & tous

    Témoignages et retour d'expériences d'éditions régionales ou de réutilisation de FAIR bioinfo

    10:45-12:30

    Pauline François
    Marie Cariou Jacques Dainat
    Pierre Marin 
    temoignage_Pauline_Francois
    temoignage_Jacques_Dainat
    temoignage_Marie_Cariou

    Pause déjeuner

    Les principes FAIR appliqués au matériel pédagogique

    13:30:14:00

    L. Khamvongsa-Charbonnier
    Les principes FAIR appliqués aux matériels pédagogiques

    Travail en sous-groupes sur le matériel de cours (diapos, exercices)

    14:00:15:30

    Tous
    Fichier JSON FAIRifier le matériel pédagogique

    Conclusion et perspectives

    15:30-16:00

    Tous