Please enable JavaScript.
Coggle requires JavaScript to display documents.
Deconvolution(2015) - Coggle Diagram
Deconvolution(2015)
网络
组件
反池化
池化
池化在卷积网络中被设计用来通过在一个感受野内抽取一个代表值来过滤噪声。但是在池化的过程中感受野内的空间信息丢失了(其实其它未进入池化的信息也丢失了)
实现
在转换变量(switch variables)中记录了在池化操作时选择的最大像素的位置,并在反池化时将像素复原到其原来的位置
-
概述
反池化通过追踪强激活像素退回到图像空间的原始位置,来获得特定样例的结构
反卷积
-
实现
通过给低分辨率的特征图每个特征中间补零,然后用一样的卷积操作起到反卷积的效果,因为这是从稀疏到稠密的过程
卷积
卷积通过学习形状细节得到区域内的分类结果,反卷积则相反。反卷积层的层次结构被用来获取不同类的形状细节。底层的滤波倾向于获取一个物体的整体形状,特定类的精细细节被编码在高层滤波中
-
结构
概述
网络由卷积网络和反卷积网络两部分组成。卷积网络与将输入图像转化到多维度特征表示的特征抽取相对应,而反卷积网络是一个从卷积网络得到的抽取的特征来产生目标分割的的形状生成器
卷积网络
概述
使用去除了最后分类层的VGG16层网络作为卷积部分,在最后增加两个全连接层来进行特定类的映射
反卷积网络
概述
反卷积网络是卷积网络的镜像版本,卷积核池化对应反卷积和反池化。物体结构被由粗糙到细致地重构;底层倾向于获得一个物体的粗略的总体构造(位置、形状和区域),而在高层会发现更复杂的特征
训练
两步训练
- 标准标记将物体实例从图像中裁剪出,这样使得物体在裁剪出的边框的正中央
- 利用候选物体来构建更复杂的样本,候选区域与被选来用于训练的标准分割充分地交叠
-
FCN的问题
- 由于固定大小的感受野,网络只能解决图像中单个尺度大小的语义分析。因此远大于或远小于感受野的目标会被分割或者错误地标注
- 由于作为反卷积层输入的标签映射太过粗略,而且反卷积过程总体上来说十分简单,因此物体的精细结构经常被丢失或者被平滑
贡献
- 首次使用Deconvolution Network进行语义分割,它由反卷积、反池化和ReLU组成
- 消除了在基于FCN模型中发现的尺度问题,同时更好的确定了物体的细节
- 取得了SOTA