DeepLabv3+:Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation
在DeepLabv3的基础上,引入解码器(Dncoder)提升语义分割的精度
什么是 DeepLabv3+?
- 语义分割关注的2个问题:(1)实例对象多尺度问题;(2) feature 分辨率下降导致预测精度降低,而造成的边界信息丢失问题。 DeepLabv3]改进 ASPP 结构解决了问题1,deeplab v3+通过编码器解决问题2
- 在DeepLabv3的基础上,引入解码器(Dncoder)提升语义分割的精度;引深度可分离卷积提高语义分割的速度
DeepLabv3+的网络结构?
- Encoder:(1)带空洞卷积的 DCNN,可以采用常用的分类网络如 ResNet、Xception;(2)基于 DeepLabv3 改进 ASPP,用于引入多尺度信息
- Decoder:其将底层特征与高层特征进一步融合,提升分割边界准确度
Deeplabv3+的解码器 (Dncoder)的使用?
- DeepLabv3 网络输出解码: 经改进的 ASPP 得到 C3或 C4的特征图,然后 1 x 1 卷积调整通道至类别数量,最后直接上采样 8 倍或 16 倍还原分辨率,这是一种非常暴力的 decoder 方法,不利于得到较精细的分割结果
- Deeplabv3+网络输出解码: 借鉴了 EncoderDecoder 结构,引入了新的 Decoder 模块,首先将 encoder 得到的上采样4x 的特征,然后与 encoder 中对应大小的低级特征 concat,为了防止 encoder 得到的高级特征被弱化,先采用1x1卷积对低级特征进行降维,两个特征 concat 后,再采用3x3卷积进一步融合特征,最后再 4 x 上采样得到与原始图片相同大小的分割预测
Deeplabv3+论文中的空洞深度分离卷积?
- 深度可分离卷积中的通道卷积改空洞卷积即可,减少计算量的同时,扩大感受野
Deeplabv3+如何改进Xception?
- (1)参考MSRA(微软亚洲研究院)的修改 ,增加了更多的层
- (2)所有的最大池化层使用stride=2深度可分离卷积(depthwise separable convolution)替换,并将其中的通道卷积(depthwise convolution)改空洞卷积(Atrous convolution)
- (3)与MobileNet类似,在3x3 depthwise convolution后增批规范化(Batch Normalization,BN)Relu