EfficientNetv1:Rethinking Model Scaling for Convolutional Neural Networks
使用 "神经结构搜索技术" 搜索网络的深度(网络层数)、宽度(channel 数量)、分辨率 (网络输入),以在有限硬件资源的情况下,得到准确度最高的模型
使用 "神经结构搜索技术" 搜索网络的深度(网络层数)、宽度(channel 数量)、分辨率 (网络输入),以在有限硬件资源的情况下,得到准确度最高的模型
GhostNetV2 在 GhostNetV1 的基础上,提出新的注意力机制,用于捕获长距离的空间信息,在精度和推理速度之间获得更好的平衡
Jupyter Notebook 是一款开放源代码的 Web 应用程序,允许您创建和共享包含实时代码,方程式,可视化和叙述文本的文档。用途包括:数据清理和转换,数值模拟,统计建模,数据可视化,机器学习等等。
翻译自 Jupyter 官网
EfficientNetv2 在 EfficientNetv1 的基础上,通过搜索 accuracy、parameter efficiency 以及 trainning efficiency 三个维度,提出 Fused-MBConv,使得它具有更快的训练速度和更好的参数效率
通过设计更加激进的跨连接,实现大量的重复梯度传递,因此可以使用较少的参数实现较快的收敛
DPN 融合了 RestNeXt 和 DenseNet 的优点,提出双路的特征提取架构
Pytorch 保存、加载模型的方法
针对目前火热的 transformer,ConvNeXt 认为不是卷积固有的劣势导致的 CNN 性能比 transformer 差,而是 CNN 的设计不充分导致的
考虑到传统卷积的平移不变性,对于一些位置敏感的任务是有害的,于是提出基于在卷积前增加座标信息作为输入