Please enable JavaScript.
Coggle requires JavaScript to display documents.
ORGANIZZAZIONE DEL GENOMA - Coggle Diagram
ORGANIZZAZIONE DEL GENOMA
ciò che varia tra le diverse
specie è la quantità di nucleotidi
non c'è una diretta relazione tra quantità
di nucleotidi e proteine da sintetizzare
ESEMPI
ESCHERICHIA COLI: 4 milioni di nucleotidi ->3000 proteine (situazione realistica)
LIEVITI: circa 12 milioni di nucleotidi ->11000 geni in teoria, in realtà sono molte meno le proteine reperibili
DROSOFILA: 165 milioni di nucleotidi ->138000 proteine (non realistico?)
GENOMA UMANO: 3200*10^6 nucleotidi ->un milione e mezzo di proteine (non realistico)
le proteine hanno mediamente 400 amminoacidi e sono quindi codificate da 1200 nucleotidi
PROCARIOTI
singola molecola di DNA circolare, che occupa uno spazio nel batterio chiamato NUCLEOIDE, meno elettrondenso del protoplasma circostante
sito unico di replicazione, da cui le forche vanno in versi opposti, scorrendo tutto il filamento
il cromosoma batterico, essendo circolari, non ha né centromeri né telomeri
OPERONI: struttura genica in cui ci sono più sequenze differenti che trascrivono per differenti peptidi, sotto il controllo dello stesso
promotore
, controllato a distanza da un gene regolatore
gli introni sono rarissimi
GENOMA SECONDARIO, OPZIONALE 1000 volte più piccolo di quello principale, chiamato PLASMIDE
STRUTTURA DEL GENE PROCARIOTICO
ORF
open reading frame
porzione centrale del gene che viene trascritta ed effettivamente tradotta in proteine; corredata di zone al 5' e al 3'
al 5' di ORF: OPERATORE e PROMOTORE hanno lo scopo di attivare la trascrizione del tratto di gene che deve essere trasformato in mRNA
SEQUENZA DI SHINE DALGARNO: tra promotore e operatore, ha il compito di agganciare la prima tripletta dell'mRNA in corrispondenza del sito P del ribosoma
nel versante 3' c'è un tratto non tradotto che serve per il distacco della molecola di RNA e funge da segnale per l'allontanamento dell'RNA dal ribosoma quando è stato completamente letto per la sintesi proteica
GENOMA EUCARIOTICO UMANO
numero di nucleotidi 2000 volte maggiore rispetto a quello procariotico
ci sono sequenze geniche e sequenze non codificanti
solo il 2% del genoma è usato per la sintesi di proteine
il 30% è costituito da sequenze correlate ai geni
il70% è costituito da sequenze extrageniche
meno del 10% è codificante
il genoma secondario non è opzionale, è rappresentato dal GENOMA MITOCONDRIALE
17000 nucleotidi
caratterizzato da 37 geni
non sufficienti per il funzionamento dei mitocondri
genoma nucleare
da decine di milioni fino ad alcuni miliardi di nucleotidi
contengono più siti di replicazione
le molecole di DNA formano strutture lineari
i cromosomi sono stati classificati in base alle loro dimensioni (inversione tra i cromosomi 21 e 22)
CENTROMERI: funzione di aggancio delle fibre del fuso che dai due poli di origine del fuso stesso si dirigono verso i cromosomi, in modo da ripartirli equamente durante le divisioni
TELOMERI: particolari sequenze, in parte a singola elica, che chiudono le estremità della molecola lineare di DNA a doppia elica in modo che queste non possano interagire con l'estremità di altri cromosomi, garantendo così l'integrità di ciascun cromosoma
sequenze singole in specifici loci o forme duplicate
STRUTTURA DEL GENE EUCARIOTICO
porzione strutturale
contiene effettivamente le sequenze che vengono trascritte in RNA
porzione regolatoria
si trova generalmente a monte, al 5' del tratto del gene che viene trascritto in RNA
ESONI: sequenze trascritte e tradotte
INTRONI: sequenze trascritte, ma non tradotte
in media le sequenze introniche sono 8/9 volte più lunghe di quelle esoniche
la porzione strutturale del gene viene poi trascritta dall'RNA polimerasi in un
RNA precoce o eterogeneo
sequenze copiate sia dalle regioni esoniche sia da quelle introniche del gene
SEQUENZA LEADER a monte del primo esone per aggiunta di una guanina per la maturazione
CODA DI POLY-A a valle dell'ultimo esone, 3' non tradotto
MATURAZIONE
splicing
sequenze consenso
ORGANIZZAZIONE E STRUTTURA
DEL GENE EUCARIOTICO
processi di maturazione
post trascrizionale
CAPPING aggiunta di guanina trifosfato all'estremo 5'
POLIADENILAZIONE sequenza di adenine che proteggono e favoriscono la traslocazione da nucleo a citoplasma
a monte del primo esone,
ci sono delle sequenze
con funzione regolatoria
TATA BOX 25 nucleotidi a monte, costituita da 8-10-12 nucleotidi, ricca di timine e adenine, favorire il riconoscimento del gene da trascrivere, in tutti i geni eucariotici
CAAT BOT 70/80 nucleotidi a monte del primo esone, favorire e promuovere la trascrizione,nell'85% dei geni
GC BOX o
isola CpG
circa 100 nucleotidi a monte, 75% dei geni , regolazione della trascrizione, controllo potente non determinato solo da fattori genetici ma anche ambientali
ENHANCER da 200 a 3000 nucleotidi a monte, potenziatrici della trascrizione
variabilità delle dimensioni dovuta principalmente alle sequenze introniche
SEQUENZE
duplicate
e DIVERSIFICATE
albumina, alfa fetoproteina e proteina GC derivanti da uno stesso comune gene ancestrale che ha dato luogo a tre copie che hanno subito piccole modifiche nel corso del tempo
esistono molti geni interparentati tra loto:
famiglie multigeniche
famiglia di geni dell'ormone della crescita
numerose copie di geni più o meno simili in particolari siti: cluster genomici
OMEOGENI
soma di un organismo
controllato nel suo sviluppo
gene antP
controlla la
disposizione di antenne
e zampe nella drosofila
più a valle dei precedenti: controllano torace, ali, disposizione delle 3 coppie di zampe
più a valle (estr. 3') conformazione e strutturazione di testa e antenne
a monte (estr. 5') : controllano porzione terminale del corpo
OMEOBOX sequenza di una sessantina di nucleotidi che individua i geni responsabili di una parte antica di SNC
possono anche essere sparpagliate nel genoma
possono essere duplicate porzioni di DNA o geni
SEQUENZE RIPETUTE IN TANDEM
molto numerose
ad esempio per RNA ribosomiali
dislocati a livello di una porzione, satellite, del braccio corto di tutti e 5 i cromosomi acrocentrici
unità di trascrizione separate da un tratto non trascritti
spaziatore
SEQUENZE MEDIAMENTE RIPETUTE
Sequenze LINES
6000 nucleotidi
tra 20 e 40% del genoma
codificanti
80-100 copie sono intatte, 5000 hanno subito mutazioni
L1
famiglia genica più rappresentata
funzione di attivare la trascrizione
Sequenze SINES
lunghezza media: 300 paia di basi
13% del genoma
elementi ALU
famiglia più rappresentata (enzima di restrizione sintetizzato da un batterio)
sono specie-specifiche
mai codificanti
Sequenze HRVS e LTR
acronimi di sequenze derivate da virus
integre in numero molto limitato
TRASPOSONI DI DNA
capaci di cambiare posizione o duplicarsi in continuazione
alla base della variabilità di dimensioni del genoma
aiutate dall'enzima trasposasi
due tipi
semplici: solo geni necessari per trasferimento in un'altra regione
complessi: segmento trasposto contiene anche geni aggiuntivi
spesso contengono geni per la resistenza ai farmaci
RETROTRASPOSONI
contengono tipicamente 2 geni codificanti
per l'enzima trascrittasi inversa
per la proteina strutturale, che veicola
l'mRNA da citoplasma a nucleo
SEQUENZE LTR per inserire fisicamente il tratto di DNA in una zona del genoma
nel nucleo, c'è un elemento L1 che
contiene i due geni ORF 1 e ORF 2
La sequenza lines è trascritta in un filamento di RNA-> maturazione-> fuoriuscita mRNA nel citoplasma-> traduzione delle due proteine fondamentali per questo processo-> rientro nel nucleo-> produzione cDNA a partire dall’mRNA ad opera della trascrittasi inversa-> integrazione del cDNA in una delle due emieliche di un cromosoma-> sintesi di un tratto complementare al cDNA appena inserito ad opera della DNA polimerasi-> ligasi.
SEQUENZE ALTAMENTE RIPETUTE
ciascun elemento ripetuto è molto piccolo (2/3 nucleotidi), costituiscono il 10% del genoma
SEQUENZE CENTROMERICHE
tipicamente presenti a livello di tutti
i CENTROMERI dei cromosomi
varia da cromosoma a cromosoma
correlate al funzionamento del processo
di separazione dei cromatidi fratelli
SEQUENZE TELOMERICHE
altamente ripetute e presenti a livello dei telomeri, oltre le regioni codificanti
non codificanti e meno abbondanti di quelle centromeriche
ESANUCLEOTIDE
identico per tutti i cromosomi con funzione di proteggere le estremità del cromosoma (che altrimenti sarebbero chimicamente reattive)
SEQUENZE MICROSATELLITI
di lunghezza variabile, compresa tra 2 e 6 nucleotidi, che si ripetono milioni di volte nel genoma
da queste si ottengono le sequenze per
le impronte digitali del DNA
PSEUDOGENI
NON PROCESSATI
sequenza mutata con funzionalità persa
duplicata per retrotrasposizione
mutazioni non patologiche perché c'è un'altra copia
a seguito di un intermedio dovuto a duplicazione dell'intera sequenza genica
PROCESSATI
originano dalla trascrizione di un gene normale il cui RNA messaggero maturo viene catturato da una trascrittasi inversa già presente nel nucleo
mRNA copiato in cDNA, quindi si dicono processati
dovuti a trascrizione del DNA tramite trascrittasi inversa
copie aggiuntive non funzionanti