Formation théorique

Analyse des données RNA-Seq sous l'environnement Galaxy

> Session :

Les 15 & 16 novembre 2016 à Lyon

Les 16 & 17 novembre  2017 à Lyon

> Durée : 2 journées – 14 heures

> Pédagogie : Effectif : 14 Personnes
La formation repose sur une riche iconographie (films et photos) que les participants sont amenés à commenter dans une dynamique interactive
Remise de support de cours
La formation sera sanctionnée par une attestation de formation.

Référence : BIF-08

> Frais pédagogiques

1200 € HT

Académiques : 1050 € HT

> Intervenant :

Dr. G. Perrière
Dr. C. Oger
Dr. C. Deschamps

> Public concerné :

Biologistes (Chercheurs, ingénieurs, étudiants) ayant en projet ou en cours des expériences de RNA-seq.


PROGRAMME

THÉORIE – INTRODUCTION GÉNÉRALE, CARACTÉRISTIQUES DES DONNÉES DE SÉQUENCES

> caractéristiques des jeux de données de séquences (454, Hiseq/MiSeq, IonTorrent, PacificBiosciences)
> présentation générale des problématiques de calcul et de stockage de données NGS
> formats de fichiers
> analyse qualité
> base de données Short Read Archive

– PRATIQUE – RÉCUPÉRATION DES DONNÉES, ANALYSE QUALITÉ

THÉORIE – INTRODUCTION À GALAXY

> Présentation de l’interface web de Galaxy
– Vue d’ensemble des outils d’analyse de données NGS disponibles sous Galaxy
– Introduction à la création et au partage de Workflows/ “Chainage de Tâches” sous Galaxy
> Présentation de l’instance Galaxy du PRABI – (support informatique des TD et guichet de services)

THÉORIE – RNA-SEQ OBJECTIFS, PLAN D’EXPÉRIENCE ET ANALYSE DE DONNÉES

> Transcriptions procaryote, euracyote> Objectifs biologiques
– annotation, mesure de l’expression (analyse différentielle), recherche des isoformes d’un gène et quantification, recherche de variants SNP…> Acquisition expérimentale
– Choix techniques expérimentaux en fonction des objectifs (longueurs des séquences, profondeur de séquençage, déplétion des ARN ribosomiques, séquençage orienté…)
– Importance du plan d’expérience> Alignement des séquences sur un génome de référence
– sans épissage (Bowtie), principe, format de fichiers
– avec épissage (Tophat, STAR…)
– analyse qualité des alignements
– visualisation (navigateur UCSC, IGV)

> Quantification et Analyse différentielle
– attribution des lectures aux gènes ou aux transcrits et quantification (htseq, cufflinks)
– notion de RPKM
– notions de statistiques utiles pour les analyses de données de séquences haut-débit
– analyse différentielle de l’expression des gènes (normalisation, DESeq2, tests multiples )

> Sans génome de référence : assemblage de novo de trancriptome
– présentation de Trinity : assemblage de transcrits
– présentation de KisSplice : assemblage local, recherche de variants d’épissage, de SNP, analyse différentielle et visualisation (UCSC)

PRATIQUE – RNA-SEQ – EXPRESSION DIFFÉRENTIELLE

> pipeline tophat / cufflinks
> pipeline tophat / htseq / DEseq, edgeR

PRATIQUE – RNA-SEQ SANS GÉNOME DE RÉFÉRENCE

> Trinity
> KisSplice, KissDE

OBJECTIFS

  • Acquérir les connaissances générales sur les méthodes de séquençage à haut-débit.
  • Connaître les caractéristiques des données obtenues dans le cadre de l’analyse du transcriptome (RNA-seq).
  • Savoir planifier une expérience simple de type RNA-seq en fonction de ses objectifs scientifiques et des caractéristiques et contraintes expérimentales.
  • Connaître les principales méthodes et outils d’analyse des données RNA-seq . Pouvoir les mettre en oeuvre dans un cas simple via un serveur web Galaxy.
  • Pouvoir visualiser les résultats dans un navigateur de génome.

Contactez nous !

Veuillez laisser ce champ vide.

Inscrivez-vous !

Veuillez laisser ce champ vide.