Please enable JavaScript.
Coggle requires JavaScript to display documents.
機器學習課程 (過程 (1.數據預處理(60%~70%) (切分, 降噪....等等, 數據組織, 減維), 數據考量 (場景 (分類問題,…
機器學習課程
過程
1.數據預處理(60%~70%)
切分
降噪....等等
數據組織
減維
數據考量
數據量大小
場景
分類問題
回歸問題
沒有標籤的問題
數據型態
文本
圖片
模型評估
2.模型學習(30%)
4.新樣本預測
切記!!!!!沒有標準答案
數據驅動解決方案
數據
python
pandas
DataFrame
類似表格的資料格式
數據分析中最適合處理的型態
seaborn
算法
強化學習
基於環境、取得最大效益
鏈式反應
例如:DD接單問題(如何能達到最佳化)
監督學習
分類
例如:垃圾郵件
y是離散值
回歸
例如:票房預測
y是連續值
有答案的預測
無監督學習
聚類
抽取數據特徵、挖掘數據關聯
例如:推薦系統、聚類
比較少去做預估、多為補充訊息
誤區
沒有最強、最好的方法
專有名詞
訓練數據
例如:題庫
類別標記
好瓜
是
否
敲聲
沉悶
清脆
數據集
測試集
訓練集
屬性、特徵、Columns
模型
例如:讀書方式
定義
模擬人
獲取新知識或技能
不斷完善自身