Catalogue des formations en calcul

SAISIE
    API     

Objectifs

La reproductibilité des expériences et des analyses est l’un des piliers de la science moderne. Néanmoins, la description dans les articles des protocoles expérimentaux, des logiciels, et des analyses est souvent lacunaire et ne permet que rarement à une tierce personne de reproduire une étude. Ces imprécisions sont devenues de plus en plus problématiques et sont une des causes du nombre croissant de rétractations d’articles, et ce même dans des journaux ou des conférences prestigieuses. Cela fini par conduire à une prise de conscience à la fois de la communauté scientifique et d’une partie du grand public qu’un certain nombre de résultats de recherches et d’études sont en réalité douteuses, trompeuses, voire erronées. Ces erreurs entraînent une certaine défiance de la part d’une société de plus en plus exigeante mais sont avant tout cause d’une perte de temps inacceptable.
La science ouverte est le terme générique désignant le mouvement cherchant à rendre la recherche scientifique et les données de la recherche les plus accessibles et transparentes possibles. La recherche reproductible recouvre les aspects techniques et sociaux de la science permettant et promouvant de meilleurs pratiques de recherche. Les pratiques méthodologiques et les modes de publications ont d’ores et déjà commencé à évoluer et l’objet de ce cours est de sensibiliser l’auditoire aux enjeux et aux défis de la recherche reproductible et les former à la méthodologie et aux outils correspondants.

Contenu

30h dont 12h en présentiel :
à partir de mi novembre 2019 jusqu’à mi janvier 2020, environ 1h30 par semaine.
Langue d'intervention : français ou anglais selon les besoins.
Suivi du MOOC sur FUN en parallèle :
https://learninglab.inria.fr/mooc-recherche-reproductible-principes-methodologiques-pour-une-science-transparente/

Le cours proposé s’appuie sur le MOOC du même nom, diffusé sur la plate-forme FUN, qui est décrit brièvement dans la section suivante. Ce MOOC devra donc être suivi en autonomie par les étudiants en parallèle aux cours.
Le cours est découpé en 8 séances hebdomadaires d’une heure et demi, interactives, et qui seront l’occasion de faire le point sur l’avancée du suivi du MOOC, de donner aux étudiants un retour personnalisé, de répondre à des questions spécifiquement liées à leur domaine ou à leur pratique, et de les accompagner dans la mise en oeuvre des différents outils.
Ces 8 séances seront calées sur le MOOC et auront pour objectif de s’assurer que chacun est en mesure de réaliser au meilleur niveau possible les différents exercices proposés dans le MOOC et en particulier celui évalué par les pairs. Le suivi du MOOC représente a minima une vingtaine d’heures de travail personnel.

Information sur le MOOC
Nous proposons dans ce MOOC trois parcours différents utilisant chacun une technologie de Notebook :
— Le premier parcours repose sur Jupyter et le langage Python (ou R). Il ne nécessite aucune installation de votre part sur votre ordinateur.
— Le deuxième parcours repose sur RStudio et le langage R.
— Le troisième parcours repose sur Emacs/Org-Mode et les langages Python et R.
Ce MOOC se divise en 4 modules, chacun composé de vidéos illustrant les concepts, de quizs permettant de s’assurer que ces concepts ont été acquis, puis d’exercices pratiques permettant de mettre en oeuvre les outils de la recherche reproductible :
1. Cahier de note et de laboratoire, prise de note avec markdown, outils de gestion de version, indexation et méta-données.
2. Document computationnel : Jupyter, Rmarkdown, ou org-mode
3. Analyse reproductible : comment réaliser une analyse reproductible à l’aide d’un document computationnel. Comment lever toute ambiguïté et s’assurer qu’une tierce personne aura accès à toutes les informations lui permettant d’inspecter, de comprendre, et de refaire un calcul.
4. Présentation des enfers de la recherche reproductible : les données, l’environnement logiciel, le calcul.
Le MOOC propose comme tâche finale la rédaction d’une analyse reproductible sur un jeu de données historique (épidémie de choléra de Broad Street en 1854, évolution de la concentration de CO2 dans l’atmosphère, etc.) qui est évaluée par les autres étudiants.

Prérequis

Pas de prérequis particulier si ce n’est une connaissance du langage python ou R pour réaliser des analyses simples. Il est indispensable de venir avec sa propre machine et d’avoir les droits d’administration pour pouvoir facilement bénéficier des outils proposés.

Entités contributrices

  • MaiMoSiNE
  • UGA

Contacts

Localisation

Adresse :
700 avenue centrale, 38400 Saint Martin d'Hères, France