年轻人起来冲

YOLACT++：Better Real-time Instance Segmentation

发表于 2022-04-26 更新于 2023-10-24 分类于 2-深度学习， E-实例分割本文字数： 1.6k 阅读时长 ≈ 1 分钟

yolactplusplus 通过引入可变形卷积、使用更多的 anchor、重新生成的 Mask scoreing 分支等措施，改进了 yolact 模型

阅读全文 »

FCOS：Fully Convolutional One-Stage Object Detection

发表于 2022-04-21 更新于 2023-10-24 分类于 2-深度学习， D-目标检测本文字数： 1.7k 阅读时长 ≈ 2 分钟

通过预测目标中心到四边的距离实现对目标的检测

阅读全文 »

SOLOv2：Dynamic and Fast Instance Segmentation

发表于 2022-04-05 更新于 2023-10-24 分类于 2-深度学习， E-实例分割本文字数： 1.1k 阅读时长 ≈ 1 分钟

SOLOv2是在SOLO的基础上设计的网络，主要是将mask预测分支解耦成掩码核预测（Mask kernel branch）和掩码特征学习（Mask feature branch），分别负责生成卷积核和需要卷积的特征映射，使得mask分支生成速度更快，最后也提出Matrix-nms快速过滤结果

阅读全文 »

SOLO：Segmenting Objects by Locations

发表于 2022-04-01 更新于 2023-10-24 分类于 2-深度学习， E-实例分割本文字数： 2.2k 阅读时长 ≈ 2 分钟

SOLO是实例分割全新赛道的论文，以前的方式是先检测出实例框，然后在实例框内分割目标，而SOLO基于最后一层featrue map(SxS)位置确定实例，然后通过mask分支生成S^2个mask,表示最后一层featrue map(SxS)所有grid对应的分割结果，汇总所有grid的结果，就是实例分割结果

阅读全文 »

PraNet：Learning Feature Pyramids for Human Pose Estimation

发表于 2022-03-29 更新于 2023-10-24 分类于 2-深度学习， F-人体姿态估计本文字数： 1k 阅读时长 ≈ 1 分钟

PyraNet 认为人体姿态的估计的难点在于不同关节部位的尺度不同，如上图 (a)手和头的比例大于脚的比例，在（b）中脚的比例大于头的比例，为此，PyraNet 基于Hourglass 网络，设计金字塔子网络去提取关节的多尺度信息，提升人体姿态估计的准确性

阅读全文 »

MSPN：Rethinking on Multi-Stage Networks for Human Pose Estimation

发表于 2022-03-24 更新于 2023-10-24 分类于 2-深度学习， F-人体姿态估计本文字数： 829 阅读时长 ≈ 1 分钟

MSPN 是对 Hourglass 的改进，可用于单目标的人体姿势检测，它认为 Hourglass 的重复降采样+不变的通道数导致信息损失，它希望是降采样时，通过更多的通道数将信息补充回来，所以借鉴CPN修改了 Hourglass 的所有satge

阅读全文 »

EfficientDet：Scalable and Efficient Object Detection

发表于 2022-03-21 更新于 2023-10-24 分类于 2-深度学习， D-目标检测本文字数： 1k 阅读时长 ≈ 1 分钟

提出了一个带权重的双向特征金字塔网络（BiFPN），它可以支持简单快速的多尺度特征融合

阅读全文 »

HRNet：Deep High-Resolution Representation Learning for Visual Recognition

发表于 2022-03-18 更新于 2023-10-24 分类于 2-深度学习， F-人体姿态估计本文字数： 1.2k 阅读时长 ≈ 1 分钟

HRNet 设计了并行的多分辨率分支，提取特征的同时，保持高分辨率，同时设计不同分支之间的特征融合，获得多尺度特征

阅读全文 »

Simple Baselines for Human Pose Estimation and Tracking

发表于 2022-03-16 更新于 2023-10-24 分类于 2-深度学习， F-人体姿态估计本文字数： 1.2k 阅读时长 ≈ 1 分钟

当前的人体姿态估计在深度学习里的发展取得了很大成功，但是在这个领域的神经网络结构变得越来越复杂，也导致对于算法的分析和比较越来越困难。所以作者提出了一个简单但是很有效的baseline网络，用来鼓励大家在这个基础之上进行创新同时使用这个baseline方法来判断新方法的表现

阅读全文 »

CPN：Cascaded Pyramid Network for Multi-Person Pose Estimation

发表于 2022-03-15 更新于 2023-10-24 分类于 2-深度学习， F-人体姿态估计本文字数： 1.1k 阅读时长 ≈ 1 分钟

CPN 网络使用 top-down 模式进行多人姿势估计，即先检测出单个人，再使用 CPN 进行关键点检测。CPN 提出两个子网络检测人体关键点，其中GlobalNet是一个功能金字塔网络，可以成功地定位“简单”的关键点（如眼睛和手），但可能无法准确识别被遮挡或看不见的关键点。而RefineNet尝试通过整合来自GlobalNet的多个尺度的特征，通过扩大感受野的方式以及在线的关键点难例挖掘损失来优化对难例关键点的检测

阅读全文 »