Please enable JavaScript.
Coggle requires JavaScript to display documents.
Unsupervised Learning Algorithm - Coggle Diagram
Unsupervised Learning Algorithm
Definisi
Algortima machine learning yang menganalisa dan mengklusterkan dataset tanpa label
Algoritma
Clustering
K-Means
Mempartisi n data ke beberapa kluster k. Penentuan cluster didasarkan pada:
Objek yang berada pada kluster yang sama memiliki tingkat kesamaan karakteristik yang sangat tinggi
Tingkat kesamaan antar objek yang berbeda cluster rendah
Hierarchical Clustering
Aglomerative
Bottoms-up approach
Data-data akan terlebih dahulu diisolasi lalu secara bertahap akan digabungkan berdasarkan persamaan yang dimiliki hingga terbentuk sebuah cluster
Divisive
Top-down approach
Data-data yang ada pada kluster akan dibagi berdasarkan perbedaan yang dimiliki tiap data
Dimension Reduction
Principal component analysis (PCA)
Merupakan metode untuk mengurangi dimensi dataset dengan cara merubah variabel data yang banyak menjadi lebih sedikit namun masih memiliki sebagian besar informasi yang ada
Singular Value Decomposition (SVD)
Merupakan faktorisasi matriks yang penting dalam aljabar linear. Selain itu, SVD juga merupakan generalisasi dari dekomposisi eigen pada matriks arbitrer. SVD ini memiliki aplikasi penting dalam pemrosesan sinyal dan statistik.
Association
Association Rule
Metode unsupervised learning yang menggunakan aturan yang berbeda untuk menemukan hubungan antara variabel dalam kumpulan data yang diberikan
Kelebihan dan Kekurangan
Kelebihan
Dapat digunakan untuk task yang lebih kompleks, karena dalam unsupervised learning tidak memiliki data input berlabel.
Lebih disukai karena mudah untuk mendapatkan data tanpa label dibandingkan dengan data berlabel.
Kekurangan
Secara intrinsik lebih sulit daripada supervised learning, karena tidak memiliki output yang sesuai.
Hasil dari algoritma unsupervised learning mungkin tidak terlalu akurat karena input data tidak diberi label, dan algoritma tidak mengetahui output yang tepat sebelumnya.
Perbedaan
Labeled Data
Unsupervised learning models, bekerja sendiri untuk menemukan struktur yang melekat pada data yang tidak berlabel.
Goals
Tujuannya untuk mendapatkan insights yang berasal dari large volumes of new data.
Applications
unsupervised learning sangat cocok untuk anomaly detection, recommendation engines, customer personas dan medical imaging.
Complexity
Unsupervised learning models memiliki komputasi yang kompleks karena mereka membutuhkan large training set untuk produce intended outcomes.
Drawback
metode unsupervised learning dapat memiliki hasil yang sangat tidak akurat kecuali kita melakukan validasi pada output yang dihasilkan
Ilustrasi proses unsupervised learning
Ilustrasi Proses Unsupervised Learning