ConvNeXt V2:Co-designing and Scaling ConvNets with Masked Autoencoders
ConvNeXtv2 借鉴掩码自编码器(MAE),在 ConvNeXt 的基础上引入全卷积掩码自编码器 (FCMAE),但是发现 MLP 层存在潜在的特征崩溃问题,为了解决这个问题,该研究提出添加一个全局响应归一化层(Global Response Normalization layer,GRN)来增强通道间的特征竞争
ConvNeXtv2 借鉴掩码自编码器(MAE),在 ConvNeXt 的基础上引入全卷积掩码自编码器 (FCMAE),但是发现 MLP 层存在潜在的特征崩溃问题,为了解决这个问题,该研究提出添加一个全局响应归一化层(Global Response Normalization layer,GRN)来增强通道间的特征竞争
图像因为相机或拍摄存在噪声、缺失和抖动问题,导致成像有噪点、不清晰,如果噪声和抖动是有规律的,那么可以通过特定的方法去除这些干扰,复原或修复图像
CSP 可以看作是 DenseNet 的升级版,主要是通过 split channel 减少重复梯度的传递,使得网络更快
和 ZFNet 类似,是一篇分析 CNN 原理的经典论文,对后来的弱监督学习有很大的启发,本文证明 2 个结论:(1)CNN 提取的 featrue 含有位置信息,尽管我们在训练时没有标注位置信息;(2)这些位置信息可以转移到其他认知任务中
通过空间全局池化生成通道注意力,通过通道全局池化生成空间注意力,并且分别使用最大池化和平均池化去生成 2 次注意力矩阵
卷积神经网络从这里开始开始火起来,主要内容包括:(1) 使用 relu 训练网络;(2) 使用 LRN 层;(3) 使用数据增强;(4) 使用 dropout;(5) 使用重叠池化
在进行 C++ 、C # 编程时,对 MFC、. Net、CLR、COM、ATL 等概念不理解,在此进行总结
使用 opencv 从摄像头连续读取图像
在使用 visual studio 2019 开发时,有涉及 CLI 编程的经历,那么什么是 CLI 编程,这和传统的 Managed C++ 有什么区别呢?本文进行总结
本文回归了 C++ 的编译过程,了解 C++ 编译的优化方法