Please enable JavaScript.
Coggle requires JavaScript to display documents.
単純ベイズ分類器 (あるデータ(文章)カテゴリー判定 (ゼロ頻度問題 (加算スムージングで再計算), 文章内のカテゴリー出現率の計算 P(C|D),…
単純ベイズ分類器
あるデータ(文章)カテゴリー判定
文章内のカテゴリー出現率の計算 P(C|D)
ゼロ頻度問題
加算スムージングで再計算
カテゴリー内の文書出現率の計算 P(D|C)
アンダーフロー対策
カテゴリー出現率の計算 P(C)
ベイズの定理
P(H)
P(D|H)
P(D)
P(H|D)
応用先
レコメンドシステム
テキスト分類
センチメント分析
リアルタイム予測
アルゴリズムの長所と短所
長所
高速で計算資源も少なくてよい
少ないトレーニングデータでも性能が出る
とても大きなデータセットに対しても有効
重要でない特徴量の影響を受けにくい
単純(実装も簡単)かつ強力
短所
各特徴量が独立であると仮定しなければならない(実データでは成り立たないことも多い)
パラメータ推定
訓練例の集合
最尤推定量
離散化
教師あり
教師なし
実例