Coggle requires JavaScript to display documents.
MULTI-SCALE CONTEXT AGGREGATION BYDILATED CONVOLUTIONS
语义分割需要结合像素级精度和多尺度上下文推理
图像分类模型和语义分割模型在结构上是不同的,但原本用于图像分类的模型应用到语义分割竟然也你能取了SOAT
稠密预测需要处理多尺度推理的冲突需求和全分辨率的预测问题。并提出两个方法 从下采样层得出的全局透视图,并用重复的反向卷积恢复损失的分辨率 提供多尺寸的输入图片,并将这些图片的预测结果进行组合
在保持卷积核不变的情况下,让卷积核跳过上一层包含重复信息的特征图进行卷积,形成一个树状没有重复信息的网络
因为固定使用3x3的卷积,而且避免特征图的重复计算,所以dilation的大小是固定指数增长的,因此可以得出感受域公式
包含7层网络,分别为1,1,2,4,8,16,1,因为第七层感受域已经到达65x65,所以不再需要dilation,最后再加一层1x1xC的卷积然后得到模块输出
具体参考代码,文中无明确说明
开始用标准的初始化流程训练网络,结果并不理想,后来实验证明使用Identity模式更有效,这个方式会让信息直接留到下一层。