FCN:Fully Convolutional Networks for Semantic Segmentation

通过反卷积 (deconvolution) 上采样、通过跳跃连接实现底层位置信息与高层语义信息,最终实现对融合技术实现对像素级的分类

什么是 FCN (Fully Convolutional Networks)?

  • FCN-20230408142959
  • 和分类的最后一层使用全连接层输出不同,分割的输出仍然是 featrue map,每个 cell 的值是对这个位置的分类,所以图像分割属于密集分类
  • FCN 通过反卷积 (deconvolution) 上采样、通过跳跃连接实现底层位置信息与高层语义信息,最终实现对融合技术实现对像素级的分类

FCN 如何实现像素级的分类?

  • 对于一般的分类 CNN 网络,网络的最后加入全连接层,经过 softmax 后就可以获得类别概率信息,但不能标识每个像素点的类别,所以这种全连接方法不适用于图像分割
  • FCN 提出把后面全连接都换成卷积,这样就可以获得一张 2 维的 feature map,后接 softmax 获得每个像素点的分类信息,从而解决了分割问题

FCN 的网络结构?

  • 语义分割学习之路(1)-FCN-20230408154027-1
  • FCN 的输入是 H x W x 3,输出是 H x W x C,C 为类别数量
  • FCN 全部由卷积层组成的网络

FCN 的损失函数?

  • 输入标签的 h×wh \times w,分割后得到的输出是 h×w×21h \times w \times 21,其中 21 为每个像素的类别概率
  • 使用交叉熵计算损失