Res2Net:A New Multi-scale Backbone Architecture

基于ResNeXt,将输入特征进行分组,并在不同分支之间设计不同深度的卷积,以实现不同分支不同感受野的目标,最终可以提升网络对多尺度目标的兼容性

什么是 Res2Net ?

  • Res2Net-20230408140838
  • ResNet ResNeXt的基础上引入多尺度特征的概念,使得模型可以提取多尺度的特征

Res2Net的网络结构?

  • Res2Net-20230408140838
  • 输入设计不同的分支,分支之间可以进行沟通,每个分支深度不同,感受野不同,最终模型可以适应不同尺度的目标

Res2Net的SE模块?

  • 对每个 Res2Net 基本块输出进行整合,即主要对下图 U 进行处理,利用系数 scale 来使网络自适应的减弱或增强该通道的特征

Res2Net与ResNet的关系?

  • Res2Net-20230408140838
  • 上图左边ResNet的基础结构,Res2Net将其中3x3卷积替换为右边分组卷积(Group Convolution) ,即将1x1之后的特征图划分为s组,每组n/s个特征图,如果s=1,Res2Net变为ResNet
  • 通过Res2NetSE模块 ,使得Res2Net比ResNet更容易聚焦在目标上

Res2Net 如何添加多尺度特征?

  • Res2Net-20230408140907
  • 将输入特征分成了几组。一组滤波器首先从一组输入特征图中提取要素。然后将上一组的输出特征图与另一组输入特征图一起发送到下一组滤波器。此过程重复几次,直到处理完所有输入特征图。最后,将所有组的特征图连接(concat)并送到另个1×1滤波器,以完全融合信息。沿着输入特征图到输出特征图任何可能路径,当通过3×3滤波器时,等效感受野都会增加,由于组合效应,得到许多等效特征尺度