Please enable JavaScript.
Coggle requires JavaScript to display documents.
Protein Embeddings - Coggle Diagram
Protein Embeddings
rappresentazioni machine readable proteine (e molecole)
one hot encoding
sequenza convertita in matrice
valori 1 e 0 per ogni lettera raffigurante amminoacidi
PSSM
rappresentazione allineamenti multipli
punteggi positivi se amminoacido molto visto in quella posizione
punteggio negativo se visto molto raramente in quella posizione
UniRep
fixed lenght vectors
Matrice di distanza
Grafi
Topological fingerprint
Voxel
per 3d structure analysis
per molecole
Grafi
Molecular fingerprint
SMILES
rappresentare molecole come stringhe di caratteri contenenti descrizione molecola
latent features
InCHI
rappresenta meglio la parte stechiometrica
NN per UniRep
utilizzo dataset estremamente ampi
RNN to learn statistical representations of protein
predizione x-esimo amminoacido noti gli amminoacidi precedenti
in maniera ricorsiva fino a fine sequenza
prende una sequenza e ne genera una rappresentazione
vettore numerico di lunghezza fissa che mi dice come la rete ha percepito la sequenza che gli ho dato in input
media valore neuroni assunti quando hanno analizzato la sequenza
i vari neuroni presenti nella rete hanno imparato proprietà sequenze proteiche
la rappresentazione viene usato come input di un altra macchina che la usa come elenco delle proprietà significative della proteina
per addestrare un altra macchina su un task specifico