Please enable JavaScript.
Coggle requires JavaScript to display documents.
Machine learning #2 Funzioni di costo Lez. 7 - Coggle Diagram
Machine learning #2
Funzioni di costo
Lez. 7
K-Means
clustering
Processo
1-Sceglie il n. di cluster
2-Genera i centroidi dei cluster
Inizialmente vengono disposti casualmente in modo che vi sia la maggior distanza possibile tra loro
3-Assegna ad ogni Xi il centroide più vicino
4-Ricalcola il nuovo centroide del cluster
5-Ripete punti 4-5 fino a quando i centroidi cambiano di una distanza trascurabile
Scelta n cluster
Obiettivi
Minimizzare la varianza all'interno del cluster (VarW)
Massimizzare la varianza tra cluster diversi (VarB)
Il rapporto tra VarW e VarB diminuisce all'aumentare di K
Stop quando diventa
non più significativa
Clustering
gerarchico (HC)
HC agglomerativo
1-Ogni punto è un cluster
2-Ad ogni step, si uniscono i due cluster più vicini fino ad averne uno
HC divisivo
1-All'inizio, un solo cluster
2-Ad ogni step, si esclude dal cluster il punto più lontano
Distanze
Single link
Distanza tra due punti appartenenti a cluster differenti
Group Average
Intercluster Similarity
Distanza media tra tutti
i punti di due cluster
Complete
link
Massima distanza tra due punti
appartenenti a cluster diversi
Distanza tra i centroidi
Risultato: insieme
di cluster annidati