click to edit title

一、机器学习算法分类

1. 监督学习(Supervised Learning)

  • 线性回归(Linear Regression)
  • 关键特性:连续值预测
  • 核心公式:(y = wx + b)
  • 逻辑回归(Logistic Regression)
  • 关键特性:分类问题
  • 核心公式:(p = \frac{1}{1 + e^{-(wx + b)}})
  • 决策树(Decision Trees)
  • 关键特性:可解释性强
  • 核心公式:信息增益、基尼不纯度
  • 支持向量机(SVM)
  • 关键特性:最大化决策边界
  • 核心公式:(y = wx + b, \min |\mathbf{w}|)

2. 无监督学习(Unsupervised Learning)

  • 聚类(Clustering)
  • K-均值(K-Means)
  • 关键特性:寻找簇心
  • 核心公式:(J = \sum{i=1}^{m}\sum{k=1}^{K}|x^{(i)} - \mu_k|^2)
  • 层次聚类(Hierarchical Clustering)
  • 关键特性:构建聚类树- 关联规则(Association Rules)
  • Apriori算法
  • 关键特性:频繁项集
  • 核心公式:支持度、置信度

3. 强化学习(Reinforcement Learning)

  • Q学习(Q-Learning)
  • 关键特性:无模型
  • 核心公式:(Q(s,a) = Q(s,a) + \alpha [r + \gamma \max_{a'}Q(s',a') - Q(s,a)])
  • 策略梯度(Policy Gradients)
  • 关键特性:基于概率的决策
  • 核心公式:梯度上升

二、算法选择指南

  • 数据类型
  • 连续值:线性回归
  • 分类:逻辑回归、SVM
  • 问题类型
  • 预测:监督学习
  • 探索性分析:无监督学习
  • 数据量
  • 大数据:深度学习
  • 中小数据:传统机器学习

三、算法评估

  • 交叉验证(Cross Validation)
  • 混淆矩阵(Confusion Matrix)
  • 准确率(Accuracy)
  • 召回率(Recall)

click to edit