Please enable JavaScript.
Coggle requires JavaScript to display documents.
ビジネス課題の機械学習による予測の インパクトと課題解決プロセス (目標/イシューを設定する (予測精度とビジネスモデル (バイアス型,…
ビジネス課題の機械学習による予測の
インパクトと課題解決プロセス
目標/イシューを設定する
ビジネスが抱える課題を特定する
KPIとデータを明確にする
KPIに相関する特徴量が必要かを事前に想定する
データの入手ができるか、利用目的の設定で勝負が決まる!
ドメインの知識を取得する
リスクと成功基準を考察する
プロジェクトの継続の可否を判断する
予測精度とビジネスモデル
バイアス型
リニア型
winner takes all型
早期飽和型
ロジスティクス型
データを取得して、探索する
適切なデータの探索
分析の粒度と予測ターゲットの定義
探索的データ解析
データロボットでできること
データの用意(利用分類)
データ前処理
学習
モデル作り
リーケージを見つけて除去
特徴量と同じ列を排除する
データの前処理(モデル化の前)
フィーチャーエンジニアリング(特徴量設計)
エンコード ダミー変数
リジット変数
組み合わせ
時刻の解釈
クリーニング
欠損値
外れ値
名寄せ
テキスト前処理
分かち書き
TF-IDF
2カラムの近似
データをモデル化する
特徴量を選択する
:check:
混同行列
リコール
プレシジョン
モデルを構築する
ROC曲線
LOSGROSS
モデルの精度を評価する
分類
閾値あり
正確性
精度
リコール
F Score
閾値なし
ROC AUC
LogLoss
回帰
RMSE
MAE
MAPE
モデルの検証と選択をする
尺度
名義
順序
間隔
比率
型
アルゴリズムの選択
バリデーション
クロスバリデーション
ホールドアウト
ダウンサンプリング
解釈して伝達する
モデルの解釈をする
モデルの比較をする
インサイトを伝達する
データを準備、予測を実装し、保守する
データの準備
バッチ・APIを使った予測の実装
予測結果の管理
モデルの保守とモニタリング