本文首发于知乎专栏“人工智能从入门到逆天杀神”,本文以及本专栏所有算法源代码都可以在神力AI平台获取,如果你没有GPU但需要预训练模型或者你想获取更多开箱即用的AI算法,欢迎加入我们的会员,一杯咖啡即可带你入门AI,传送门:http://manaai.cn。本文欢迎二次转载,但请保留原作版权信息,即该段信息,谢谢合作!

在上一篇文章中,我给大家介绍了如何采用更加先进的特征抽取方式来做目标检测器的回归。于是我们尝试了如何构建一个FPN即特征金字塔。我们在上一篇文章结尾的时候,基本上构建完了所有的代码,但还没有训练并进行测试查看最终结果。

我们由于时间关系仅仅训练了4-5个Epoch,但效果已经非常不错,这一点跟SSD改进很大,任何一阶段算法诸如SSD,DSSD,RefineDet,RFBNet在训练的早期都会出现大量检测结果的情况,这得益于特征金字塔的bottom-up, stop-down的编解码策略以及focal loss的强大选择能力,在训练的早期就可以干掉大部分的背景。具体效果如何:

only 4 epochs result, about 30 epochs the result could be much more accurate:

相应的源代码整体工程文件可以在这里找到:

神力AI(MANA)-国内最大的AI代码平台​manaai.cn

预测方式

我们最终实现的模型将所有的检测pipeline和nms集成到了一起,并且采用了GPU实现的nms,即使在python上也不会在nms这一步浪费太多时间。因为我们的时间实在太宝贵了,分秒必争。

预测脚本:

import 

整个预测过程还是比较简单,这个预测脚本从文件夹读取所有图片,进行预测。另外在我们的原始工程中,也提供了对webcam和视频文件进行预测的脚本。

总结

通过这个实现,我们得到了一些经验上的收获,总结来说如下:

  • 速度相对于二阶段来说够快,精度也很错,关键是能够在短时间内得到一个几乎可用的模型;
  • 毫无疑问这个方法如果接上mask head也能有比较不错的表现,原因是它的特征抽象能力很强并且定位很准确,这一点你从一些比较少的类别可以在短时间内精准回归可以看得出来。

在我们完成这边文章的时候,来自MANA AI社区的朋友想让我们实现一个基于fpn+ssd的rbox检测器,简单来说从回归矩形框到回归带有reotation的矩形框,感兴趣的朋友也可以参考他在mana社区发起的讨论:

FPN+RSSD : help in implementing the model​talk.strangeai.pro

我们将会在接下来的文章中继续实现这些功能:

  • mask head加入实现一个能够快速检测+实例分割的检测器;
  • 如上一位同学所说,尝试加入rotation量进行回归。

resnet50加入fpn_FPN+SSD同时兼顾速度和精度的检测器(二)相关推荐

  1. 阿里达摩院开源DAMO-YOLO:兼顾速度与精度的新目标检测框架

    作者丨陈威华 阿里达摩院智能计算实验室 编辑丨极市平台 1.简介 DAMO-YOLO是一个兼顾速度与精度的目标检测框架,其效果超越了目前的一众YOLO系列方法,在实现SOTA的同时,保持了很高的推理速 ...

  2. 极市直播预告丨阿里达摩院:兼顾速度与精度的高效目标检测框架DAMO-YOLO

    |极市线上分享第106期 | 一直以来,为让大家更好地了解学界业界优秀的论文和工作,极市已邀请了超过100位技术大咖嘉宾,并完成了105期极市线上直播分享.往期分享请前往http://bbs.cvma ...

  3. 达摩院 | DAMO-YOLO:兼顾速度与精度的新目标检测框架

    作者 | 陈威华  编辑 | 极市平台 点击下方卡片,关注"自动驾驶之心"公众号 ADAS巨卷干货,即可获取 点击进入→自动驾驶之心[目标检测]技术交流群 后台回复[2D检测综述] ...

  4. Talk预告 | 阿里巴巴达摩院算法工程师许贤哲:DAMO-YOLO:兼顾速度与精度的高效目标检测框架

    本期为TechBeat人工智能社区第463期线上Talk! 北京时间12月15日(周四)20:00,阿里巴巴达摩院算法工程师--许贤哲的Talk将准时在TechBeat人工智能社区开播! 他与大家分享 ...

  5. 不能兼顾速度与精度,STOC 2021最佳论文揭示梯度下降复杂度理论

    ©作者 | 机器之心编辑部 来源 | 机器之心 梯度下降算法具有广泛的用途,但是关于它的计算复杂度的理论研究却非常少.最近,来自利物浦大学.牛津大学的研究者从数学的角度证明了梯度下降的计算复杂度,这项 ...

  6. TPAMI 2021 | 时间走向二维,基于文本的视频时间定位新方法兼顾速度与精度

    ©作者 | 张宋扬.彭厚文等 来源 | 机器之心 当时间的维度从一维走向二维,时序上的建模方式也需要相应的改变.本文提出了多尺度二维时间图的概念和多尺度二维时域邻近网络(MS-2D-TAN)用于解决视 ...

  7. TPAMI 2021 | 让时间走向二维,基于文本的视频时间定位新方法:MS-2D-TAN,兼顾速度与精度!...

    关注公众号,发现CV技术之美 本文转载自机器之心 作者:张宋扬.彭厚文.傅建龙.卢亦娟.罗杰波 当时间的维度从一维走向二维,时序上的建模方式也需要相应的改变.本文提出了多尺度二维时间图的概念和多尺度二 ...

  8. 日本东北大学改进单阶段人脸检测—兼具速度与精度优势

    点击我爱计算机视觉标星,更快获取CVML新技术 近日来自日本东北大学与Laboro.AI公司的研究人员公开一篇改进的单阶段人脸检测算法论文,其不仅保持了速度的优势而且在主流的人脸数据集上达到与双阶段人 ...

  9. 深度学习(五)优化算法--提高神经网络的训练速度和精度

    转自:https://blog.csdn.net/red_stone1/article/details/78348753 上节课我们主要介绍了如何建立一个实用的深度学习神经网络.包括Train/Dev ...

最新文章

  1. 新书来了!《ActionScript 3.0游戏设计基础(第2版)》
  2. python 替换空格
  3. [JavaWeb-HTML]HTML概念介绍和快速入门
  4. 【Python】自动化升级所有pip安装的包
  5. 初探Thymeleaf模板引擎
  6. android简易双屏支持【转】
  7. mysql事件的使用-开启与关闭事件
  8. C#的百度地图开发(一)发起HTTP请求
  9. Zynq硬件开发之Xilinx官方技术手册解读(一)
  10. mysql封机器码,lol机器码解除(同理支持市面上任意一款游戏)解机器码
  11. 将国家名和缩写的字典存入json文件
  12. cad命令栏还原默认_CAD命令行不见了怎么重新恢复?
  13. Python学习笔记(9):函数调用与定义
  14. [Ynoi2014]不归之人与望眼欲穿的人们
  15. c语言编写方波信号的思路,频率可调的方波信号发生器设计及电路
  16. 微操作、微命令、微指令、微程序、微周期、微地址
  17. 【编程DIY】一.几个有趣的小程序
  18. 2004版最新核心期刊目录
  19. 使用python玩阴阳师,自动抽到SSR
  20. CMS内容管理系统之文章信息模块的实现

热门文章

  1. 51 NOD 1227 平均最小公倍数(杜教筛)
  2. P2770 航空路线问题(网络流)
  3. Manthan, Codefest 19 (open for everyone, rated, Div. 1 + Div. 2)
  4. 牛客网 【每日一题】6月10日 失衡天平
  5. [TJOI2011] 书架(线段数优化dp + 单调栈)
  6. Codeforces Round #725 (Div. 3) 题解
  7. P6620 [省选联考 2020 A 卷] 组合数问题(斯特林数、下降幂)
  8. P3287-[SCOI2014]方伯伯的玉米田【二维树状数组,dp】
  9. 主席树 - 可持久化线段树
  10. 2016 Multi-University Training Contest 1 1004 GCD(ST表+二分)