Please enable JavaScript.
Coggle requires JavaScript to display documents.
评估方法, 性能度量, 决策树, 神经网络, 线性模型, 支持向量机 - Coggle Diagram
评估方法
留出法
D = S∪T S是训练 T是预测
交叉验证法
划分为K个大小的互斥子集
自助法
重复采样
调参:parameter tuing
性能度量
P-R曲线
回归任务常用 均方误差
错误率:分类错误的样本数占样本总数
精度= 1-错误率
查准确率P=真正例/(真正例+假正例)
查全率R=真正例/(真正例+真反例)
查准率与查全率正好相反
决策树
属性集
选择最优属性
剪枝处理
处理过拟合
前剪枝
根据划分后验证集的精度
后剪枝
信息增益最大的被选为划分属性
根节点 信息熵
增益率
多变量决策树 合理的线性分类器
神经网络
5.2感知机与多层网络
连接权与阈值
关键在于权重
多层神经网络 深度学习
预训练
微调
5.1神经元模型
输出 为0或者1
5.3误差逆传播算法(BP算法)
提升模型在测试集上的预测效果的主题叫做泛化(generalization),相关方法被称作正则化(regularization)。神经网络中常用的泛化技术有权重衰减等
线性模型
基本形式
对数几率回归
线性判别分析
投影到一条直线,同类投影尽可能近,异类投影点尽可能的远
线性 回归
支持向量机
二类分类模型
寻找有最大间隔的超平面