3.根据选择的模型,确定模型种类
支持向量机(Support Vector Machine)
逻辑回归
模型种类
- 二类分类(Binary Classification)
- 多类分类(Multiclass Classification)
把多分了问题转换成多个二分类问题,1表示是这个分类,0表示不是这个分类
作用
解决线性回归无法很好解决离散分类问题
解决方法
加入激活函数,通常是sigmoid
线性回归为什么不能解决分类问题
当数据分布如线1所示,我们需要人工的判断中间的分界点,这个很不容易判断
线性回归(Linear Regression)
模型种类
N元M次方程
作用
用线性方程解释数据,预测问题
1. 数据预处理阶段
从源数据到模型输入数据
2. 根据问题和目标,确定学习类型
监督学习(Supervised Learning)
分类
分类(Classification)
定义
通过输入,得出一个离散型的输出
回归(Regression)
例子
给定房子特征,预测房子售价
理解
用于解决预测连续输出结果的问题
定义
- 通过输入,得出一个连续的输出
- In a regression problem, we are trying to predict results within a continuous output, meaning that we are trying to map input variables to some continuous function.
理解
数据输出有明确的标签,数据输入和输出存在关系,模型的目标就是模拟这种关系,并通过输入预测输出
定义
- 给定的数据集已经知道输出的结果,而且输入和输出存在关系
- we are given a data set and already know what our correct output should look like, having the idea that there is a relationship between the input and the output.
5. 根据上述步骤,组合模型
步骤
- 确定输入的shape和数据
- 确定输出的shape和数据
- 设计从输入到输出的步骤
- 设计损失函数和optimizer
- 组合上述步骤
原理
前向传播
理解
从特征输入到得到预测值的层级拓扑
反向传播
理解
正向传播保存计算值,然后利用链式法则从后往前逐步求导
前置条件
- 正向传播计算图
- 正向传播得到预测值后代入代价函数,计算得出最后结果
可选优化方法
6. 初始化hparams
理解
用于解决预测离散输出结果的问题
例子
给定房子特征和估价,预测房子能否卖出
特征
决策边界(Decision Boundary)
因为g(x)输出的结果是一个连续型小数,或者说是一个可能性,但是实际需要输出的是一个离散型的0或1。那么,就需要划定一个边界E,大于这个W为1,小于为0,这个E就叫决策边界