深度学习的数学基础
学习深度学习,第一个门槛总是“数学要学什么,学多少?”,本文介绍了需要学习的数学知识
学习深度学习,第一个门槛总是“数学要学什么,学多少?”,本文介绍了需要学习的数学知识
本文记录自己学习 C# 多线程的过程与思考
本文记录自己学习 Python 多线程的过程和思考
SAM通过transformer将点、框、Mask、文本等prompt和图片进行编码学习,可以实现对图片任意目标的分割
通过设计新的预测头 T-Head 和样本对齐损失 (TAL),实现分类、定位分支的对齐,使得两个分支的最佳锚框更加接近。这样可以减少“低分类概率+准确位置预测”、“高概率预测+不太准确预测”这两种情况目标的漏检
YOLOv7通过扩展高效聚合网络(E-ELAN)、一致性的模型缩放策略、模型重参数化和动态标签分配,实现更高的精度
HSSN抛弃传统的每个像素进行扁平分类的思想,在借鉴层次聚类的想法后,在网络输出端增加"类别树"约束,使得网络学习到的特征更加鲁棒
EAST基于FCN输出,对每个grid进行文本行预测,可实现旋转矩形框、任意四边形框的预测
属于EAST的演进版本,还是类似 anchor-free 的方式预测文本行,除了输出 grid 的 score +边框预测外,还输出更多的文本实例信息,比如 grid 到实例矩形四角、中心点、四边的距离,使得SAST可以检测弯曲文本行、中间有间隔的文本行