Analyse transcriptomique

Principales techniques d'analyses transcriptomiques

Transcriptome = ensemble des ARN
Diff cellule saine et cancéreuse = même génome mais transcriptome, protéome et métabolome différents

RT-PCR

Oligo dR : RT pour ARNm

Random hexamer : RT de tous les ARN

Amorces : RT transcrit d'intérêt

→ PCR : En point final (classique), quantitative (temps réel), multiplex (K amplicons) ou Long-Range (amplification transcrit entier car polymerase + efficace)

→ Séquençage Sanger ou NGS

Puces à ADN (micro array)

Profil d'exp° du transcrit du gène

ARNm → RT → ADNc → fluo + hybridation avec sondes ADN → Analyse exp° globale selon fluo

Puces à ARN

Analyse différentielle d'exp° à large échelle : identif° de 25 000 à 50 000 transcrits

Signature transcriptomique

Extension puces ADN

miARN : moins instable que transcrit classique, complexe entre miARN et ARNm bloquant transcrit

Limites : hybridation pas à 100%, capture de transcrit seulement connus et pas de dif° des transcrits alternatifs (normaux ou non)

Séquençage à haut débit : RNAseq

Application du NGS : même technique mais librairies différentes

1) Purification : Purif polyA : ARNm OU Exclusion ARN ribosomaux seulement

2) Fragmentation : chimique ou enzymatique OU RT puis fragmentattion ADNc (sonique, enzymatique...)

3) Préparation librairies : RT et fix° adaptateur brin spé
4) NGS

Illumina

Haut débit : 1% du génome transcrit mais +srs copies donc couverture doit être importante et ncssite bcp de reads par échantillons (>200 millions pour transcrits rares et > 50 millions pour 1 transcriptome)

Ciblée

PCR : peu coûteuse mais 1-10 transcrits max

Capture des transcrits : milliers de transcrits mais sondes coûteuses (billes magnétiques avec streptavidine/biotine)

Autres applications : ARNlnc : traduits dans cancers ; ARN circulaires : non codant mais participe à exp° de d'autres

Single cell RNAseq : identification de sous pop, isole différentes étapes d'un process bio (...)

Long read en RNAseq (séq transcrit entier)

Nanoporetechnologie

ARN passe dans le pore ce qui modifie flux d'e- détecté par machine qui analyse quelle base est passée dans le pore

Transcrit entier et pas cher MAIS quantification peu précise, bcp d'erreur de séq et 1-2 échantillons par flow cell

Sequel technologie = PacBio : moins d'erreur car même ADNc lu plusieurs fois mais uniquement qualitatif, 1-2 échantillons par flow cell

Analyses bioinformatiques

Etapes

1) Alignement : paramètrage de librairie brin spé sens ou anti sens ; longueurs des reads; nbr d'erreurs acceptées

2) Annotation : à quoi ça correspond par rapport aux données, avec différents programmes

3) Quantification : compter nombre de reads par gène, exon, jonctions

Normalisation nombre de read

Valeur en RPKM = reads per kb of exon model per million reads

Valeur en FPKM = fragments per kb of exon model per million reads (~RPKM quand sb)

Visualisation des données par logiciels

Applications signature transcriptomique en RC

Techniques et moyen d'application : RNAseq ou microarray : analyse différence d'exp° des 23 000 gènes → quelques gènes identifiés → mise au point RT-qPCR → Test biomarqueur

Core biomarqueur : intégration dans un modèle stat

Choisir un seuil : courbe ROC

Mesure de performance

Ex : OncotypeDx (Genome Health) : test diagnostic moléculaire permettant d'analyser bio individuelle d'une tumeur du sein par évaluation de l'act de 21 gènes à partir du tissu tumoral