DeepLabv3+：Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation

发表于 2019-03-29 更新于 2023-10-24 分类于 2-深度学习， C-语义分割阅读次数：本文字数： 969 阅读时长 ≈ 1 分钟

在DeepLabv3的基础上，引入解码器(Dncoder)提升语义分割的精度

什么是 DeepLabv3+?

语义分割关注的2个问题：(1)实例对象多尺度问题；(2) feature 分辨率下降导致预测精度降低，而造成的边界信息丢失问题。 DeepLabv3]改进 ASPP 结构解决了问题1，deeplab v3+通过编码器解决问题2
在DeepLabv3的基础上，引入解码器(Dncoder)提升语义分割的精度；引深度可分离卷积提高语义分割的速度

DeepLabv3+的网络结构？

Encoder：(1)带空洞卷积的 DCNN，可以采用常用的分类网络如 ResNet、Xception；(2)基于 DeepLabv3 改进 ASPP，用于引入多尺度信息
Decoder：其将底层特征与高层特征进一步融合，提升分割边界准确度

Deeplabv3+的解码器 (Dncoder)的使用?

DeepLabv3 网络输出解码： 经改进的 ASPP 得到 C3或 C4的特征图，然后 1 x 1 卷积调整通道至类别数量，最后直接上采样 8 倍或 16 倍还原分辨率，这是一种非常暴力的 decoder 方法，不利于得到较精细的分割结果
Deeplabv3+网络输出解码： 借鉴了 EncoderDecoder 结构，引入了新的 Decoder 模块，首先将 encoder 得到的上采样4x 的特征，然后与 encoder 中对应大小的低级特征 concat，为了防止 encoder 得到的高级特征被弱化，先采用1x1卷积对低级特征进行降维，两个特征 concat 后，再采用3x3卷积进一步融合特征，最后再 4 x 上采样得到与原始图片相同大小的分割预测

Deeplabv3+论文中的空洞深度分离卷积？

深度可分离卷积中的通道卷积改空洞卷积即可，减少计算量的同时，扩大感受野

Deeplabv3+如何改进Xception?

（1）参考MSRA(微软亚洲研究院)的修改，增加了更多的层
（2）所有的最大池化层使用stride=2深度可分离卷积(depthwise separable convolution)替换，并将其中的通道卷积(depthwise convolution)改空洞卷积(Atrous convolution)
（3）与MobileNet类似，在3x3 depthwise convolution后增批规范化(Batch Normalization,BN)Relu