Please enable JavaScript.
Coggle requires JavaScript to display documents.
机器学习 (定义 (任务T 分类:计算机程序需要制定某些输入属于k类中的哪一类
输入缺失分类:输入向量的每个度量不被保证的分类
…
机器学习
定义
任务T
- 分类:计算机程序需要制定某些输入属于k类中的哪一类
- 输入缺失分类:输入向量的每个度量不被保证的分类
- 回归:计算机程序需要对给定输入预测数值
- 转录:机器学习系统观察一些相对非结构化表示的数据,并转录信息为离散的文本形式。(输入图片,输入出图片的描述)
- 机器翻译:输入是一种语言的符号序列,计算机必须将其转化成另一种语言的符号序列
- 结构化输出:输出是向量或者其他包含多个值的数据结构,并且构成输出的这些不同元素间具有重要关系(输入文本,输出语法结构树)
- 异常检测:在一组事件或对象中筛选,并标记不正常或非典型的个体(通过信用卡消费记录判断信用卡盗帅)
- 合成和采样:生成一些和训练数据相似的新样本(语音合成)
- 缺失值填补
- 去噪
- 密度估计或概率质量函数估计(不懂什么意思)
描述
如果一个程序可以在任务T上,随着经验E的增加,效果P也可以随之增加,则称为这个程序可以从经验中学习
例子
在对垃圾邮件分类的任务中,”一个程序”指的就是需要用到的机器学习算法,”任务T”指区分垃圾邮件的任务,”经验E”为已经区分过是否为垃圾邮件的历史邮件,在监督式学习问题上,这也被称为训练数据;”效果P”为机器学习算法在区分垃圾邮件任务上的正确率.
性能度量P(评估函数)
为了评估机器学习算法的能力,我们必须设计其性能的定量度量
-
实现步骤
2. 构建模型
-
指导思想
- 确保第一个模型简单易用
- 我们先有个想法Idea,先选择初始的参数值,构建神经网络模型结构;然后通过代码Code的形式,实现这个神经网络;最后,通过实验Experiment验证这些参数对应的神经网络的表现性能。根据验证结果,我们对参数进行适当的调整优化,再进行下一次的Idea->Code->Experiment循环。
- 快速的提出模型、实施、修正模型,而不是在某一步花过多时间
- 着重确保数据管道的正确性
- 使用简单且可观察的指标进行训练和评估
- 拥有并监控您的输入特征
- 将您的模型配置视为代码:进行审核并记录在案
- 记下所有实验的结果,尤其是“失败”的结果
备注
- 大概率出现的问题,要提前预防的放在设计模型,如grad_norm
- 跑了之后才知道的,调试模型使用的,放在评估模型部分,如过拟合
-
-
-
特征
-
没有免费午餐定理
没有一个机器学习算法总是比其他的要好