Please enable JavaScript.
Coggle requires JavaScript to display documents.
群集分析法 - Coggle Diagram
群集分析法
資料量大
非階層式
KMeans
- 選定K個初始集群的形心(centroids)或種子點(seeds),其中K是假定想要分群集群數目。
- 選取前K個沒有遺漏值的觀察值作為初始集群的形心或種子點。
- 先選取第一個沒有遺漏值的觀察值作為第一個集群的種子,第二個集群的種子則選取與第一個種子的距離超過某個特定標準者,第三個集群的種子則選取與先前二個種子的距離超過某個既定標準者。依此方法,直到選出K個集群的的種子。
- 以隨機方式選出K個沒有遺漏值的觀察值作為集群的形心或種子。
- 先選擇K個種子,次則依照某種特定規則(規則如種子間的距離儘可能夠遠)重新調整種子。
- 使用簡單合理的方式確認集群的形心,使形心間的距離儘可能夠遠。
-
- 計算每個觀察體到各集群形心距離遠近,將每一個觀察體分派到離其最近集群。
- 根據事先假定的調整規則,重新分配或重新配置每一個觀察值到K組集群中。
- 如果重新分配資料點能滿足調整規則條件,則重複步驟2、步驟3,直到資料點無法重新配置。
-