click to edit title
一、机器学习算法分类
1. 监督学习(Supervised Learning)
- 线性回归(Linear Regression)
- 关键特性:连续值预测
- 核心公式:(y = wx + b)
- 逻辑回归(Logistic Regression)
- 关键特性:分类问题
- 核心公式:(p = \frac{1}{1 + e^{-(wx + b)}})
- 决策树(Decision Trees)
- 关键特性:可解释性强
- 核心公式:信息增益、基尼不纯度
- 支持向量机(SVM)
- 关键特性:最大化决策边界
- 核心公式:(y = wx + b, \min |\mathbf{w}|)
2. 无监督学习(Unsupervised Learning)
- 聚类(Clustering)
- K-均值(K-Means)
- 关键特性:寻找簇心
- 核心公式:(J = \sum{i=1}^{m}\sum{k=1}^{K}|x^{(i)} - \mu_k|^2)
- 层次聚类(Hierarchical Clustering)
- 关键特性:构建聚类树- 关联规则(Association Rules)
- Apriori算法
- 关键特性:频繁项集
- 核心公式:支持度、置信度
3. 强化学习(Reinforcement Learning)
- Q学习(Q-Learning)
- 关键特性:无模型
- 核心公式:(Q(s,a) = Q(s,a) + \alpha [r + \gamma \max_{a'}Q(s',a') - Q(s,a)])
- 策略梯度(Policy Gradients)
- 关键特性:基于概率的决策
- 核心公式:梯度上升
二、算法选择指南
- 数据类型
- 连续值:线性回归
- 分类:逻辑回归、SVM
- 问题类型
- 预测:监督学习
- 探索性分析:无监督学习
- 数据量
- 大数据:深度学习
- 中小数据:传统机器学习
三、算法评估
- 交叉验证(Cross Validation)
- 混淆矩阵(Confusion Matrix)
- 准确率(Accuracy)
- 召回率(Recall)
click to edit