Durée
2 jours
Faculté
Faculté des Sciences
Présentation
Les notebooks Jupyter sont des environnements informatiques interactifs exécutés dans un navigateur Web, qui permettent une intégration facile avec des bibliothèques scientifiques d’apprentissage, de deeplearning, data-mining, classification et de visualisation. Ils offrent des gains de productivité significatifs dans les domaines liés à l’analyse de données. Les notebooks Jupyter sont utilisés de plus en plus fréquemment dans le cadre de publications scientifiques, de part leur format ouvert et reproductible.
D’un point de vue pédagogique, les notebooks Jupyter sont devenus des outils précieux pour de nombreux cours en analyse de données, bio-informatiques et informatiques.
Nous proposons, par le biais de la plate-forme RPBS, une formation à l'intention des biologistes possédant des bases en programmation et souhaitant maîtriser un des outils les plus polyvalents du moment.
Objectifs
Les notebooks Jupyter permettent aux scientifiques d'interagir avec des outils informatiques, du code et des données via un navigateur Web. Les notebooks Jupyter peuvent être utilisés avec n'importe quel langage de programmation et peuvent également s'intégrer aux outils de ligne de commande. (franky.volny @ univ-paris-diderot.fr)
Ce cours vise à présenter aux participants Jupyter des technologies associées. Cela peut contribuer à améliorer la productivité de la recherche quotidienne, à enseigner à une classe d’étudiants et à adapter la recherche aux principes de données FAIT (trouvable, accessible, interopérable, réutilisable).
Compétences visées
* Comprendre les applications potentielles des notebooks Jupyter
* La capacité d’appliquer Jupyter pour faciliter la recherche quotidienne
* L’application de Jupyter à l’analyse et à la visualisation de données interactives
* Utiliser Jupyter pour publier des recherches scientifiques de manière reproductible
* Utiliser Jupyter pour faciliter la collaboration et l’enseignement
Programme
Jour 1
9.30 – 12.00: Introduction à Jupyter
- Pourquoi Jupyter? Les avantages et les inconvénients de l'informatique interactive
- Comment Jupyter fonctionne t-il avec n'importe quel langage de programmation, pas seulement Python ?
- Explication du fonctionnement de l'interface du navigateur et de l'exécution des cahiers Jupyter
- Exemples de cahiers Jupyter (Python, R, C ++, Fortran) et intégration à la ligne de commande
- Expérience pratique de l'exécution de commandes et de cellules de cahiers simples
Déjeuner (12.00 – 13.00)
13.00 – 17.30: Intégration de Jupyter dans vos recherches quotidiennes (session pratique)
- Intégration pratique de Jupyter aux outils de calcul existants. Les participants sont invités à apporter leurs propres scripts, programmes et données
- Génération rapide de graphiques simples
- Intégration de plusieurs langages de programmation et démarquage dans le même cahier
Jour 2
9.00 – 11.30: Jupyter et analyse de données interactives (session pratique)
- Analyse interactive de données à l'aide de bibliothèques scientifiques Python (Numpy, Scipy)
- Bibliothèques pour visualiser et tracer (matplotlib, vega-lite, nglview, ggplot)
- Des widgets interactifs pour contrôler l'analyse et la visualisation en temps réel
11.30 – 12.30: Jupyter pour la publication et l'enseignement
- Explication des principes FAIR
- Utiliser des cahiers comme publications scientifiques
- Lancer Jupyter de n’importe où, en utilisant simplement un navigateur
- Exemples de cahiers Jupyter dans des publications de recherche existantes
- Démonstration de l'utilisation de Jupyter dans l'enseignement
Déjeuner (12.30 – 13.30)
13.30 – 17.00: Science reproductible et collaborative (session pratique)
- Utilisation de Jupyter avec des référentiels de données
- Utiliser Jupyter avec Github
- Utiliser Jupyter avec Docker (repo2docker, binder)
- Introduction à Jupyterlab
Admission
Public cible
Ingénieurs, techniciens, chercheurs des entreprises et collectivités dans des domaines à l’interface de l’informatique (bio-informatique, biostatistiques, traitement du signal) et portant sur l’analyse de données.
Pré-requis
La maîtrise d'au moins un langage de programmation (Python, R, Fortran, C, …) est requise. Une bonne connaissance des commandes UNIX est vivement recommandée.
Droits de scolarité
Financement individuel: 500 €
Financement tiers: 1.000 €
Contacts
Reine Rigault
Contact(s) Formation Continue- 01 57 27 82 34
- fcsdv@u-paris.fr