Please enable JavaScript.

Coggle requires JavaScript to display documents.

6個資料科學的常見錯誤 - Coggle Diagram

- - - - 克服隨機雜訊 (Average out)
      - 資料多到包含絕大多數特徵，過擬合也沒關係
    - - 當模型複雜度不夠，會導致underfitting。underfitting的情況下，資料的數量對訓練模型沒有幫助。
  - - - 已經觀察到的資料是否包含問題中，大部分應被注意到的特徵
    - - 這是For ML，不一定在DL適用
        
        當複雜度持續上升，模型訓練效果又會下降
- - - - 機器學習的數值大小是有意義的，如果是順序的等距尺度，要確定數值上保持等距。
- - - - 許多預訓練模型都基於知名資料集訓練，繼承這些模型的同時，也peek到這些資料集了。
- - - - AB testing還是需要有夠多人參與驗證。
- - - - 但F1會很低 (因為precision很低)