一种two-stage的目标检测算法,设计感兴趣区域池化(RoIPooling),并去掉SVM训练的获选框分类器;最终,在选择性搜索(SelectiveSearch,SS)之后,神经网络可以进行端到端训练

阅读全文 »

SPPNet 的目标检测思想和 RCNN 一致,都是提取候选区域的一维特征进行获选区域分类及位置回归,通过引入空间金字塔池化 (SpatialPyramidPooling, SPP)实现任意大小图片输入得到得到固定长度输出,避免 R-CNN 重复卷积的过程,提高了运行速度

阅读全文 »

目前的语义分割还是通过逐像素点的密集分类框架完成,但有时不太理想。本文设计了一种双流模型,在常规流之外引入形状流分支额外处理形状信息,而且负责处理形状信息的网络结构不用太深就可以提升细小结构的边缘分割效果

阅读全文 »

利用CNN进行目标检测的首个神经网络,首先利用选择性搜索提取图片的2000个左右的 Region Proposal,然后通过AlexNet提取得到固定长度的特征,接着使用支持向量机(SVM)分析这些特征,以实现获选区域的分类,使用边界框回归分析这些特征,获取获选框更精细位置

阅读全文 »

LEDNet使用非对称的编码器-解码器结构,编码器在残差层采用信道分割和混洗操作,以特征重用的方式增强了信息通信。另一方面,解码器采用APN模块,其中空间金字塔结构有利于扩大感受野,而无需引入大量的计算

阅读全文 »