Please enable JavaScript.
Coggle requires JavaScript to display documents.
Predizione Struttura Secondaria - Coggle Diagram
Predizione Struttura Secondaria
Struttura Secondaria
piccola frazione struttura polipeptide
si ripetono + volte nelle stesse proteine
divergono meno rapidamente delle strutture primarie
molto meno variabili
Categorie
3 su cui
posso fare la predizione
Loops/Turns
tutto il resto
alpha-elica
Beta-foglietto
foglietto pieghettato, a zig zag
nella pratica sperimentale se ne usano 8
alpha elica, 3_10 elica (meno stretto), tt elica (più stretto)
Beta_strand, Beta_Bridge, Beta_turn
bend, the rest
per ogni amminoacido di una determinata sequenza io ho una determinata struttura
DSSP
H per strutture ad elica
E per strutture a foglietto
L per tutto il resto
si passa da una 20 ina di simboli ripetuti ad una ripetizione di solo 3 simboli
Algoritmo di Classificazione
usa dati noti e la loro classificazione per costruire un set di pattern
pattern usati poi per classificare nova sequenza abbinandogli una struttura secondaria (per ogni singolo amminoacido)
2 stadi
Training
creare pattern
Testing
misurare l'accuratezza predittiva con dati noti
Early Methods
accuratezza limitata
dati limitati
ragioni metodologiche
Preferenze osservate
si assegnava all'amminoacido la struttura secondaria in cui appariva più frequentemente nei casi noti
seguendo regole note
es
Le proline si trovano solo all'inzio di un elica e mai alla fine, ecc...
calcolare frequenza posizione per posizione
Metodo Chou Fasman
uso tabelle propensità per i 3 stati e per le diverse posizioni
likelihood per ogni struttura per ogni amminoacido
si estraeva dalla tabella stretch in cui i valori erano tutti superiori a 100
procedura
1
identificazione regione dove 4 su 6
(3 su 5 per i foglietti) avessero valore >100
2
si cerca di estendere la regione per capire se le regioni vicine potessero formare un elica (o un foglietto)
in caso di sovrapposizione
se sum P(H) > sum P(E)
alpha elica
se sum P(E) > sum P(H)
beta foglietto
Turn Prediction
più complesso (prob. combinata)
Problemi Principali
Accuratezza del 70% con l'elica ma non con il foglietto
28-48%
predizione + corte di ciò che viene osservato poi
Next Generation of SPP
performance migliorate attraverso
uso degli omologhi
Peer Pressure
Training sets migliori
Omologhi
discendenti da un antenato comune
osservate pattern conservati in sequenze omologhe rafforza la predizione
BLAST
software che trova proteine simili a quella in input entro un certo livello di attendibilità
Expectation Value e Score
Allineamento
Multiplo
allineamento fra più proteine candidate omologhe
si limita l'errore dovuto dalla coincidenza che abbiano sequenze simili
PSIPRED
algoritmo che usa BLAST
accuratezza 70/80%
Peer Pressure
lavorare su una finestra di amminoacidi alla volta
si controlla anche assenza di amminoacidi incompatibili con una determinata struttura
aumento di precisione dal 50 al 80%
Pattern di Amminoacidi
indicativi sia per i beta foglietti
sia per le alpha eliche
ci sono delle ricorrenze
Beta: i, i+2,i+4 pattern of
conserved hidrofobic residues
alpha: i,i+3,i+4,i+7 pattern
Breakers
crea un angolo che spezza la struttura
PSSP
usa finestre da 11 a 21 amminoacidi
accuratezza di circa il 70%
Inserzioni-Delezioni
si possono inserire interruzioni quando si confrontano proteine
penalizzate dagli algoritmi, non avendo una base reale
abbastanza improbabili