知识点
overfitting/underfitting
降维
梯度下降
MBGD小批量梯度下降
BGD批量梯度下降
SGD随机梯度下降
cost function
经验风险
结构风险
BP神经网络
PCA
click to edit
L1/L2正则化
L1 向量中各元素绝对值之和
L2 各元素平方和求平方根
L0 非0个数
L2范数可以防止过拟合,提升模型的泛化能力
bias/virance
特征值 特征向量
Cov(X,Y) = E(X-E(X)(Y-E(Y)))协方差矩阵
将高维空间中的点映射到低维空间中
svm
click to edit
click to edit
优点
结构风险最小
非线性,通过惩罚变量/核函数技术来实现
需求样本较少
click to edit
tree-based model
随机森林
决策树
Gradient Boosting Machine