Please enable JavaScript.
Coggle requires JavaScript to display documents.
Machine Learning di superfici di energia potenziale - Coggle Diagram
Machine Learning
di superfici di energia potenziale
Ab initio
rispetto alle force fields prediligono l'accuratezza alla dimensione
Machine Learning
efficienza dei force filed,
accuratezza degli ab initio
si vuole che il modello riesca a calcolare la superficie di energia potenziale del sistema
superficie rappresentata come serie di bordi energetici
(curve isoenergetiche)
si selezionano n° punti sulla superficie di potenziale (input al ML)
Multilayer feed forward NN
input-hidden-output
(bias)
bias per uniformare tutte le osservazioni e per avere tutti gli zeri allineati
informazione propagata da uno strato al successivo
NO FEEDBACK
può essere usato per predizioni, dopo che ho trovato i best fit
limitazioni:
selezione coordinate principali difficile
non posso usare direttamente le coordinate atomiche
lascio al sistema il compito di combinare le coordinate nel modo più efficiente possibile
combinazione lineare dei vari contributi energetici
si presta per studiare sistemi piccoli con proprietà complesse, non abbastanza per le proteine
Descriptor based
modella sistema in termini di distanza angoli
uso descrittori strutturali del sistema per calcolare energie
end to end
non modella sistema in termini di descrittori
gli passo l'intero blocco delle coordinate della raffigurazione e l'energia
il sistema apprende l'interazione tra configurazione sistema e energia
più complicati da addestrare
NN come funzione di energia per complessi proteina- recettore
classificare atomi in base alla loro tipologia chimica
descirttori= interazioni tra atomi in funzione della distanza
528 tipi di interazioni fra questi atomi, le conto in funzione della distanza
equazione di Boltzman
frequenza contatti a certa distanza legata all'energia per quella tipologia di contatto a quella distanza
per addestrare
studio anche casi negativi
partendo dalla struttura corretta, introduco distorsioni per creare DECOYS
studio anche iRMSD (root mean square deviation of atomic position) per studiare deviazioni strutturali rispetto al modello giusto
mappe di contatto
(li uso come input)
rappresentate molto spesso come grafi
utili per predire struttura funzionale
Deep Mutational scanning data
mutanti amminoacidi sequenze
n° mutanti possibili= len sequenza per 20
misuro attività ogni variante (oppure la stabilità termica)
posso rappresentare proteina come grafo e decorare ogni nodo del grafo con i dati relativi ai mutanti generati
misuro impatto quando muto in un determinato modo