機器學習

特性

優點:易解釋模型推導過程(白箱),與深度學習相比不需大量資料即可訓練模型

分類、回歸

異常、偵測

Random Forest隨機森林

Logistic Regression

Decision Tree決策樹

NN神經網路

PCA主成份分析

K-mean

SVM支持向量機

缺點:準確率比深度學習低,對於例外狀況的預測較差

用來做分類,找出一個Decision boundary,讓兩類間的Margin最大化。

用來做異常偵測,在ML中做降維 (Dimension reduction)、特徵擷取(filter)。

做為分類或回歸的運算,具有模型易於理解和解釋、只需很少的資料等優點。

用來做分類的,分類問題在參數型學習,通常都是用最大概似函數估計法 MLE求解

一種分群(Cluster)的統計方法

步驟

1.先決定要分k組,並隨機選k個點做群集中心

2.將每一個點分類到離自己最近的群集中心(可用直線距離)。

3.重新計算各組的群集中心(常用平均值)。

反覆 2、3 動作,直到群集不變,群集中心不動為止。

多個決策樹組合而成的