Please enable JavaScript.
Coggle requires JavaScript to display documents.
機器學習 (大類 (監督學習 (分類問題 (解決選擇題,選出正確答案 (例如我是不是帥哥)), 回歸問題 (預測連續結果 (例如:…
機器學習
大類
監督學習
有題、有答案
分類問題
解決選擇題,選出正確答案
例如我是不是帥哥
回歸問題
預測連續結果
例如: 我到底有多帥,給我的分數
工業界使用最多、最須關注
無監督學習
挖掘數據的關聯模式、沒有標準答案對照
購物欄分析問題
監督與無監督都要先提取特徵
強化學習
滴滴司機接單問題
如何基於環境行動,取得最大利益
解決的問題是有延遲的
稀牛提供教材
Hands-On Machine Learning with Scikit-Learn and TensorFlow
scikit-learnm機器學習庫
檔案
檔案part1_机器学习基本知识.ipynb
part2_sklearn初识.ipynb
part3_sklearn分类算法一览.ipynb
簡單算法可視化
part4_sklearn回归建模.ipynb
過程
模型(學習方法)
2.模型學習30%
規律總結
3.模型評估
跌代、學習
數據預處理60~70%
組織、切分、降噪、特徵提取
4.新樣本預測
開發
評估數據
1.先考量數據量大小
2.場景
分類、回歸、聚類
3.數據型態
文本數據、圖片
共通點:都是解決X->Y的問題
訓練數據(訓練手冊)
類別標記(label)
ex:色澤、性別
最好用的數據型態-DataFrame
數據集
測試集
訓練集
樣例(example)
屬性、特徵
需求
巨量的數據量
超高的數據維度
數據驅動
數據
python、pandas、seaborn
算法
沒有最好的算法、都要基於數據類型、場景
方法
通過算法,總結規律,用在新數據上預測
定義
模擬人,獲取新知識,不斷完善自身
演變
人工智能
機器學習
深度學習
學習目標
學習如何使用:scikit-learn