作者丨 qiuqiuqiu@知乎(已授权)
来源 | https://zhuanlan.zhihu.com/p/400474142
编辑 | AI约读社

Yolo-FastestV2

  • 简单、快速、紧凑、易于移植

  • 资源占用少,单核性能优异,功耗更低

  • 更快更小:以0.3%的精度损失换取30%的推理速度提升,减少25%的参数量

  • 训练速度快,算力要求低,训练只需要3GB显存,gtx1660ti训练COCO 1 epoch仅需4分钟

Github:https://github.com/dog-qiuqiu/Yolo-FastestV2

贴图先和yolo-fastest-1.1对比下:

是的,这次我没有优化精度,这次优化的是速度,毕竟追求的是fastest..,不过,用0.3%的精度损失换取30%推理速度的提升以及25%的参数量的减少,至少我觉得还是挺值,与其说追求的速度,其实更加注重的是算法效果与推理效率的性价比。

先说说Yolo-Fastest的初衷吧,其实早期轻量的目标检测大家多是用的Mobilenet-SSD,其实在实际测试中,在常用的ARM设备上是很难达到实时的,只有在一些高端手机大核全开勉强达到实时,更别说工业界常用的"性能强悍的"RK3399等ARM CPU呢,达到实时基本是不可能的。包括后来自己用mobilenet对yolov3进行轻量级的优化,用1.8BFlops的计算量在Kirin 990性能上大核全开达到~55fps,虽然能在高端手机上达到很好的速度,但是在一些低端的手机CPU以及工业界常用的高端芯片RK3399,还是没法满足实时的。其次,在实际的应用中,考虑功耗,系统资源占用,一般也不会多核全开去推理模型,毕竟还得留些资源给其他应用,所以我一般部署模型只会设置单核,最多也是双核。尤其在手机上,功耗问题特别严重,假如模型推理时CPU占用过高的话,会引起过热降频,反而会适得其反,其次还有续航的减少。

所以,不光只单单看模型的推理耗时,还得着重关注模型推理所消耗的系统资源,内存,CPU占用等,例如两个模型都可以在cpu上达到30fps,但是模型A是在单核的情况下达到实时,cpu占用才20%,模型B是在4核全开的情况下达到实时,cpu占用可能100%,但是模型B效果可能要好一些,这种情况下需要权衡利弊。

Yolo-Fastest注重的就是单核的实时推理性能,在满足实时的条件下的低CPU占用,不单单只是能在手机移动端达到实时,还要在RK3399,树莓派4以及多种Cortex-A53低成本低功耗设备上满足一定实时性,毕竟这些嵌入式的设备相比与移动端手机要弱很多,但是使用更加广泛,成本更加低廉。

Yolo-FastestV2改进

先说这一版的改进吧,首先模型的backbone替换为了shufflenetV2,相比原先的backbone,访存减少了一些,更加轻量,其次Anchor的匹配机制,参考的YOLOV5,其实YOLOV5与Darknet的官版YOLOV4在Anchor的匹配机制的区别还是挺大的,这点不细讲了,网上解析一大堆,其次是检测头的解耦合,这个也是参考YoloX的,将检测框的回归,前景背景的分类以及检测类别的分类有yolo的一个特征图解耦成3个不同的特征图,其中前景背景的分类以及检测类别的分类采用同一网络分支参数共享。最后将检测类别分类的loss由sigmoid替换为softmax。对了,这次还是只有输出11x11和22x22两个尺度的检测头,因为发现在coco上三个检测头(11x11,22x22,44x44)和两个检测头(11x11,22x22)的精度无太大差异,个人感觉原因如下:1.backbone对应44x44分辨率的特征图太少2.正负anchor的严重不平衡3.小物体属于难样本对于模型学习能力要求高

最后,大家可能关心的是和yolox和nanoDet的对比,精度肯定比不过啊, 不过速度应该会快个两三倍,那体积只有 1.3M 的 PP-YOLO Tiny("比 YOLO-Fastest 更轻、更快?")呢,Emmm...用int8的量化后体积和yolo-fastest的fp32的体积比,有点亏...YOLO-FastestV2 int8可是仅仅只有250kb哦,虽然我没跑过PP-YOLO Tiny,但是应该还是比他快。所以,模型的选择还是看大家需求哦。

RK3399和树莓派4搭配ncnn bf16s,YOLO-FastestV2 是可以实时的哦

模型的最终实测效果:

本文仅做学术分享,如有侵权,请联系删文。

下载1

在「计算机视觉工坊」公众号后台回复:深度学习,即可下载深度学习算法、3D深度学习、深度学习框架、目标检测、GAN等相关内容近30本pdf书籍。

下载2

在「计算机视觉工坊」公众号后台回复:计算机视觉,即可下载计算机视觉相关17本pdf书籍,包含计算机视觉算法、Python视觉实战、Opencv3.0学习等。

下载3

在「计算机视觉工坊」公众号后台回复:SLAM,即可下载独家SLAM相关视频课程,包含视觉SLAM、激光SLAM精品课程。

重磅!计算机视觉工坊-学习交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有ORB-SLAM系列源码学习、3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、深度估计、学术交流、求职交流等微信群,请扫描下面微信号加群,备注:”研究方向+学校/公司+昵称“,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进去相关微信群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的视频课程(三维重建系列、三维点云系列、结构光系列、手眼标定、相机标定、orb-slam3等视频课程)、知识点汇总、入门进阶学习路线、最新paper分享、疑问解答五个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近2000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

圈里有高质量教程资料、答疑解惑、助你高效解决问题

觉得有用,麻烦给个赞和在看~  

Yolo-FastestV2: 更快,更轻,移动端可达300FPS,参数量仅250k相关推荐

  1. YOLO-FastestV2:更快,更轻!移动端高达300 FPS!参数量仅250k

    作者丨qiuqiuqiu@知乎 来源丨https://zhuanlan.zhihu.com/p/400474142 编辑丨CVer YOLO-FastestV2项目链接: https://github ...

  2. Yolo-FastestV2 移动端可达300FPS,参数量仅250k

    对比Yolo-Fastest: 最强轻量级目标检测yolo fastest_jacke121的专栏-CSDN博客 精度对比: Network COCO mAP(0.5) Resolution Run ...

  3. 使用现场总线更快更远

    使用现场总线更快更远 Going faster and further with Fieldbus PROCENTEC等行业专家表示,基于RS-485的现场总线技术(PROFIBUS®)和工业以太网( ...

  4. YOLOv5全面解析教程③:更快更好的边界框回归损失

    作者|Fengwen.BBuf 边界框回归是目标检测的关键步骤,在现有方法中,虽然被广泛用于边界框回归,但它不是针对评估指标量身定制的,即 Intersection over Union (IoU). ...

  5. 更快更安全,HTTPS 优化总结

    在网站升级到 HTTPS 之后,我们还可以有很多玩意可以折腾,优化 HTTPS,让它更快更安全.这里是一篇 HTTPS 优化的总结,也包含问题的解决方法,不过不仅仅包括 HTTPS 的优化,也包含 H ...

  6. 极智Paper | YOLOv7 更高 更快 更强

      欢迎关注我的公众号 [极智视界],获取我的更多笔记分享   大家好,我是极智视界,本文解读一下 更高.更快.更强的 YOLOv7:Trainable bag-of-freebies sets ne ...

  7. 清华大学丁霄汉:深度网络重参数化——让你的模型更快更强

    不到现场,照样看最干货的学术报告! 嗨,大家好.这里是学术报告专栏,读芯术小编不定期挑选并亲自跑会,为大家奉献科技领域最优秀的学术报告,为同学们记录报告干货,并想方设法搞到一手的PPT和现场视频--足 ...

  8. 同样采用WordPress搭建的网站,如何让你的网站更快更安全?

    WordPress是世界上应用最广泛的开源CMS程序,全世界排名前1000万的网站,约33.4%都是基于WordPress搭建的.其界面精美,模板丰富.可自定义性强.尤其是提供了成千上万的免费和高级插 ...

  9. 18135usm_更快更安静 佳能18-135mm USM镜头解析

    在135mm画幅相机上,24-70mm或是24-105mm等这些标准变焦镜头由于具备能广能长的焦段而受到很多用户的喜爱,而在APS-C画幅相机上自然也是如此,诸如18-55mm.18-135mm这些镜 ...

  10. 实用的it知识学习_怎样能更快更好的学习好书法?分享一些比较实用的理论知识...

    如何能更快更高效的学习书法?首先了解一些书法理论知识是很有必要的!它能让你在学习书法的过程中不至于迷茫 !能助你更快学好书法! 一.书论在实践中产生 我们大部分人都觉得学习书法可以没有理论,但不可无技 ...

最新文章

  1. linux查找maven安装目录_Linux 安装 maven
  2. window下ffmpeg的编译
  3. YTU 1495 蛇行矩阵 YTU 1607 字符棱形YTU 1959 图案打印YTU 2016 打印金字塔
  4. 终极利器|一篇文章讲清楚Python虚拟环境
  5. python语言及其应用电子版翁正秋_Python语言及其应用pdf
  6. python框架django的使用_Django框架的基本使用,若依框架
  7. Execute SQL Task 参数和变量的映射
  8. Linux故障自愈脚本,实现故障自愈要攻克的3个问题以及开箱即用的方案
  9. 表达式必须具有与对应表达式相同的数据类型_跟光磊学Java开发-运算符和表达式...
  10. ORACLE RMAN增量备份经典理解
  11. 一条命令解决macmnsvc.exe占用8081端口的问题
  12. TCP拥塞控制——慢开始与拥塞避免AIMD
  13. 简述autocad在测绘工程中的应用_AutoCAD在工程测绘制图中的应用
  14. 【Python】实现B站MP4格式音频与视频合并,ffmpeg一个命令即可
  15. 免费配音软件哪个好?快把这些软件收好
  16. 酒店项目 酒店管理系统酒店在线预订系统
  17. matlab绘制蔓叶线,powerdraw
  18. 怎么把.txt转换成html,怎么把txt转换成HTML
  19. SharePoint 2010 类似人人网站内信功能实施
  20. 微信小程序--嘟嘟会议--会议发布和我的会议查看

热门文章

  1. 51Nod1253 Kundu and Tree 容斥原理
  2. mysql插入数据显示:Incorrect datetime value: '0000-00-00 00:00:00'
  3. linux 在后台运行数据库导入导出命令
  4. day 34 进程线程排序 抢票 初级生产者消费者
  5. 计算机网络与应用第三次笔记
  6. 书柜的尺寸(bzoj 1933)
  7. 线程、同步异步、队列
  8. 将对象绑定到WinForm中的combobox时出现的奇怪错误:组合框的下拉项太多!
  9. 最严格的身份证校验(Java版)
  10. 反编译那些事儿(二)—枚举的反编译