SOLOv2是在SOLO的基础上设计的网络,主要是将mask预测分支解耦成掩码核预测(Mask kernel branch)和掩码特征学习(Mask feature branch),分别负责生成卷积核和需要卷积的特征映射,使得mask分支生成速度更快,最后也提出Matrix-nms快速过滤结果

阅读全文 »

SOLO是实例分割全新赛道的论文,以前的方式是先检测出实例框,然后在实例框内分割目标,而SOLO基于最后一层featrue map(SxS)位置确定实例,然后通过mask分支生成S^2个mask,表示最后一层featrue map(SxS)所有grid对应的分割结果,汇总所有grid的结果,就是实例分割结果

阅读全文 »

PyraNet 认为人体姿态的估计的难点在于不同关节部位的尺度不同,如上图 (a)手和头的比例大于脚的比例,在(b)中脚的比例大于头的比例,为此,PyraNet 基于Hourglass 网络,设计金字塔子网络去提取关节的多尺度信息,提升人体姿态估计的准确性

阅读全文 »

当前的人体姿态估计在深度学习里的发展取得了很大成功,但是在这个领域的神经网络结构变得越来越复杂,也导致对于算法的分析和比较越来越困难。所以作者提出了一个简单但是很有效的baseline网络,用来鼓励大家在这个基础之上进行创新同时使用这个baseline方法来判断新方法的表现

阅读全文 »

CPN 网络使用 top-down 模式进行多人姿势估计,即先检测出单个人,再使用 CPN 进行关键点检测。CPN 提出两个子网络检测人体关键点,其中GlobalNet是一个功能金字塔网络,可以成功地定位“简单”的关键点(如眼睛和手),但可能无法准确识别被遮挡或看不见的关键点。而RefineNet尝试通过整合来自GlobalNet的多个尺度的特征,通过扩大感受野的方式以及在线的关键点难例挖掘损失来优化对难例关键点的检测

阅读全文 »