Please enable JavaScript.
Coggle requires JavaScript to display documents.
09_Multiallineamento (analisi di sequenze) - Coggle Diagram
09_
Multiallineamento
(analisi di sequenze)
Definizione
Collezione di tre o più sequenze di proteine (o acidi nucleici) che sono parzialmente o completamente allineate
Iresidui omologhi sono allineati in colonne attraverso la lunghezza della sequenza
in senso evolutivo
in senso strutturale
Exact methods
usano programmazione dinamica
garantiscono soluzione ottima
non adatti se si hanno poche sequenze
Proprietà
non necessariamente un allineamento "corretto" di una famiglia di proteine
le sequenze proteiche evolvono
strutture tridimensionali delle proteine si evolvono
per due proteine che condividono il 30% di identità amminoacidica, circa il 50% dei singoli amminoacidi sono sovrapponibili nelle due strutture
Progressive alignment Feng and Doolittle
Metodo Euristico
Non garantisce di trovare la soluzione ottima
Richiede n(n-1)/2 allineamenti a coppie
Clusta IW
Tre Fasi
[2] Crea un albero guida
Converti punteggio di similarità in distanza (l'albero mostra la distanza tra gli oggetti)
Use UPGMA
ClustaIW fornisce sintassi per descrivere l'albero
[3] Allinea progressivamente le sequenze
Allineamento sequenze multiple usando l'albero
Parti con le due sequenze più vicine
e aggiungi via via le altre più vicine
Fino alla fine
once a gap, always a gap
Gli spazi vengono spesso aggiunti alle prime due sequenze (più vicine)
Modificare le scelte iniziali di gap in seguito significherebbe dare più peso a sequenze lontanamente correlate
Mantenere le scelte iniziali di gap significa avere fiducia che tali gap siano più credibili
Decision Time
[1] Esegui una serie di allineamenti a coppie globali - scegli best score