Crise de reproductibilité
La disruption numérique : une bascule brutale
Qui bouscule l’existant
- Uber : La première compagnie de taxi n’en possède aucun ;
- AirBnB : Le premier fournisseur de logement n’en possède pas ;
- Skype : La première compagnie de téléphonie ne possède pas de standard ;
- Facebook : Le premier fournisseur d’info ne crée pas de contenu ;
- Netflix : Le premier diffuseur de film ne possède pas de salle de cinéma.
Le déluge de données en Science
Les techniques à haut débit, une révolution qui provoque un déluge de données. Par exemple pour le génome humain :
- en 1990 = 13 ans et 3 Milliards $
- en 2015 = quelques heures et 1000 $
Par conséquent :
- La quantité de données à stocker et analyser explose
- Le rendement d’analyse chute
Répondre aux questions de Science
Avant
- Concevoir l’expérimentation
- Collecter des résultats
- Analyser des résultats
Maintenant
Un changement de paradigme
- Générer massivement des données
- Organiser (stocker, documenter, annoter)
- Analyser (extraire de l’information)
- Diffuser l’information
Les ravages du temps
Les défis de la reproductibilité
En psychologie
En biologie
Source : 1,500 scientists lift the lid on reproducibility”. Nature. 533: 452–454 - 2016
Disruption + Big Data + Crise
Le traitement de l’information (scientifique) sera notre Noeud Gordien
Question
Quelle définition pour les données de la recherche ?
Pour tenter d’aborder cette question, nous allons procéder en 4 étapes :
- Vous allez prendre un temps de réflexion individuelle de 5 minutes pour rédiger sur le document partagé une première définition qui vous est personnelle.
- Pendant les 5 minutes suivantes, vous discuterez de vos définitions avec trois autres participants et proposerez une définition combinée, en gardant la trace des divergences s’il y a lieu. Donc vous finissez ces 5 minutes avec 1 définition 3.Votre groupe prendra connaissance de l’ensemble des définitions consolidées proposées puis une discussion portera sur les divergences entre ces définitions (temps prévu 10 minutes)
- L’activité se terminera par la présentation des définitions les plus courantes des données de la Recherche
Définition
Les données de recherche sont les preuves qui sous-tendent la réponse à la question de recherche et peuvent être utilisées pour valider les résultats, quelle que soit leur forme (i.e. imprimée, numérique ou physique).
Il peut s’agir de renseignements quantitatifs ou d’énoncés qualitatifs recueillis par les chercheurs dans le cadre de leurs travaux par expérimentation, observation, modélisation, entrevue ou autres méthodes, ou de renseignements tirés de preuves existantes.
Les données peuvent être brutes ou primaires (par exemple, directement issues de mesures ou de collectes) ou dérivées de données primaires par analyse ou interprétation (e.g. nettoyées ou extraites d’un ensemble de données plus vaste), ou encore dérivées de sources existantes dont les droits peuvent être détenus par d’autres.