Giter VIP home page Giter VIP logo

fair_bioinfo's Introduction

Welcome !

FAIR_Bioinfo - DOI

Gitbook - DOI

Docker image -

Licence pour le code -

Licence pour le GitBook - CC BY-SA 4.0

Bienvenue à FAIR_bioinfo

FAIR_Bioinfo est une formation initialement pensée pour la communauté francophone. En effet, les ressources sont nombreuses concernant la reproductibilité en anglais mais un manque se faisait sentir en français. Vous trouverez tout le contenu du cours présenté dans les différentes sessions (slides en français). Nous proposons aussi la version retranscrite de ces cours au format gitbook en anglais : https://fair-bioinfo.gitbook.io/fair-bioinfo/

FAIR_Bioinfo is a training course initially designed for the French-speaking community. Indeed, there are many resources concerning reproducibility in English but there was a lack in French. You will find all the course content presented in the different sessions (slides in French). We also offer the transcribed version of these courses in gitbook format in English: https://fair-bioinfo.gitbook.io/fair-bioinfo/

Informations pratiques

  • Quand ? : le dernier vendredi après midi de chaque mois (sauf juillet à définir), rdv 12h30
  • Durée ? : 1h30 (questions incluses)
  • Lieu ? : Salle de conférence A.Kalogeropoulos, b. 400, campus Orsay

Objectifs

L'objectif est de proposer et d'utiliser un panel d'outils permettant la réalisation d'un projet complet de bio-info en partant de rien et aboutissant à la création d'un conteneur (technologie Docker). Le partage, la valorisation et l'analyse dynamique des données seront inclus dans le panel. FAIR correspond à l'acronyme anglais "Findable, Accessible, Interoperable, & Reusable", initialement défini pour les données mais que nous détournons ici pour leurs protocoles d'analyse. Le projet support est une étude "d'expression différentielle de gènes" à partir de données RNAseq d'O.tauri.

Pré-requis

Quasi-rien ... Savoir taper sur un clavier ?

Contact

Communications orales

La mémoire du code

Nouveaux outils pour la session

  • Git
  • Github

Programme :

  • Présentation du dépot local Git et du dépôt distant Github
  • Mise en pratique par un exemple simple

Date : 26/11/2018

Orateur : Thomas Denecker

Slides : Git/Github

Wiki : Git, Github et Markdown

Ce n'est pas de la magie

Nouveaux outils pour la session

  • Terminal

Programme :

  • Présentation du projet et de l'application finale
  • Présentation des données
  • Présentation du workflow de l'analyse
  • Ouvrir un terminal (Mac Os, Ubuntu ou Windows)
  • Initialisation du projet sur Git/Github
  • Premier script shell : création de l'arborescence du projet
  • Amélioration du script shell : récupération des données

Date : 25/01/2019

Orateur : Thomas Denecker

Slides : Session 2

Installer et jouer avec les outils d'analyse

Nouveaux outils pour la session

  • conda
  • quelques outils d'analyse pour des données RNAseq

Programme :

  • Présentation des outils du workflow (FastQC, Bowtie2, Samtools, HTseq-Count)
  • Installation de FastQC à la main
  • Présentation de conda
  • Script pour l'installation de FastQC avec conda
  • Amélioration du script d'installation : ajout des autres outils (travail à la maison)
  • Amélioration du script d'analyse : workflow d'analyse à faire en boucle pour chaque échantillon (à faire tourner à la maison)

Date : 22/02/2019

Orateur : Thomas Denecker & Claire Toffano

Slides : Session 3

Une virée en mer

Nouveaux outils pour la session

  • Docker
  • Cloud IFB

Programme :

  • Présentation de docker
  • Ecriture du dockerfile
  • Utilisation du docker avec le script d'analyse
  • Partager le docker : Docker Hub
  • Pourquoi ? utilisation dans un cloud (ex. IFB)

Date : 29/03/2019

Orateur : Thomas Denecker

Slides : Session 4

I've got the power !

Programme :

La parallélisation

  • Snakemake
  • Comparaison avec le script.sh

Le cluster de calcul

  • C'est quoi?
  • Cluster de l'IFB / I2BC
  • Singularity ↔ Docker
  • Exemple sur l'IFB et l'I2BC

Date : 26/04/2019

Orateur : Thomas Denecker

Slides : Session 5

LoveR

Programme :

Rappel R

Le package Shiny

  • Import d'un fichier
  • Affichage d'un tableau
  • Connection tableau <-> graphique
  • Graphique R de base avec paramétrage

Teasing de la puissance de R

  • Exploration des données : dplyr
  • Réalisation de graphiques : plotly, google chart, ggplot2
  • Lecture de fichiers spéciaux : fasta, fastq, excel
  • Croisement de jeux de données : upset R

Date : 24/05/2019

Orateur : Thomas Denecker

Slides : Session 6

Notebooks

Programme :

Markdown

Jupyter / Jupyterlab

  • Docker Jupyter
  • Mise en ligne avec Binder

Rmarkdown

Générer le notebook de l'application shiny

Date : 21/06/2019

Orateur : Thomas Denecker

Slides : Session 7

Example : Binder

Achever un projet reproductible

Programme :

Exposer son projet

  • Une vitrine sur web : Github pages
  • Ajouter une licence
  • Versionner son projet : Release
  • Obtenir un DOI : Zenodo

Et maintenant ?

  • Encore plus loin dans la reproductibilité
  • Limites de notre solution

Date : 05/07/2019

Orateur : Thomas Denecker

Slides : Session 8

fair_bioinfo's People

Contributors

thomasdenecker avatar clairetn avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.