FCN:Fully Convolutional Networks for Semantic Segmentation

通过反卷积(deconvolution)上采样、通过跳跃连接实现底层位置信息与高层语义信息,最终实现对融合技术实现对像素级的分类

什么是 FCN (Fully Convolutional Networks)?

  • FCN-20230408142959
  • 和分类的最后一层使用全连接层输出不同,分割的输出仍然是 featrue map,每个 cell 的值是对这个位置的分类,所以图像分割属于密集分类
  • FCN 通过反卷积(deconvolution)上采样、通过跳跃连接实现底层位置信息与高层语义信息,最终实现对融合技术实现对像素级的分类

FCN如何实现像素级的分类?

  • 对于一般的分类CNN网络,网络的最后加入全连接层,经过softmax后就可以获得类别概率信息,但不能标识每个像素点的类别,所以这种全连接方法不适用于图像分割
  • FCN提出把后面全连接都换成卷积,这样就可以获得一张2维的feature map,后接softmax获得每个像素点的分类信息,从而解决了分割问题

FCN的网络结构?

  • 语义分割学习之路(1)-FCN-20230408154027-1
  • FCN 的输入是 H x W x 3,输出是 H x W x C,C 为类别数量
  • FCN全部由卷积层组成的网络

FCN的损失函数?

  • 输入标签的 h×wh \times w,分割后得到的输出是 h×w×21h \times w \times 21,其中 21 为每个像素的类别概率
  • 使用交叉熵计算损失