jde多目标_PaperReadingGroup-14-实时多目标跟踪文章理解
![](/assets/blank.gif)
本文将简要描述实时多目标跟踪文章“Towards Real-Time Multi-Object Tracking”的内容,并谈谈笔者的思考。
原文链接:
https://arxiv.org/abs/1909.12605arxiv.org
github:
Zhongdao/Towards-Realtime-MOTgithub.com
![](/assets/blank.gif)
- Why
以往我们做跟踪的思路一般是:一个视频进来,每一帧做检测,检测的结果(也就是每个目标的包围盒)输入给跟踪模块,跟踪模块再调用一个模型,对每个目标的小图提取特征,将前一帧的所有目标的特征跟当前帧的做比对,找到前后两帧目标的对应关系(也即所谓的association过程)。
可以看出,通过这种方式,检测需要一个模型,目的是输入大图,输出目标小图,跟踪也需要一个模型,目的是输入目标小图,输出小图特征,再将前后两帧的小图特征做匹配。这一整套的耗时就是两个模型的推理耗时之和。
乍看,这样的作法似乎有冗余的地方?我们能不能有一个模型,输入大图,输出直接是目标包围盒和目标特征呢?
本篇文章提出的Joint Detection and Embedding (JDE)的模块就实现了这种方法,将两个模型融合成了一个:
![](/assets/blank.gif)
2. How
那么,这一功能是如何实现的呢?如下图:
![](/assets/blank.gif)
先看(a),主干网络采用了特征金字塔( Feature Pyramid Network 即 FPN)的结构,将多尺度的特征输出给prediction head;
图(b)就是prediction head的结构,feature map先是经历一些卷积操作,最后输出一个尺度为(6A+D)*H*W的dense prediction map(这是文章给它起的名字,实际上就是一堆feature map),其中,H和W为map的高宽,(6A+D)是map的channel数,A指anchor数,D指特征维数,这(6A+D)个map,2A用来做目标包围盒的分类loss(上图蓝色),4A用来做包围盒的回归loss(上图黄色),D用来输出特征(上图红色)loss,最后的总loss是将各loss加权求和。
这里要说明的是:
(1)包围盒的分类和回归做法实际上就是传统的检测模块,分类loss采用交叉熵,回归loss采用smooth L1,权重也跟检测一样;
(2)用来输出特征的那个loss用的是识别问题中常用的triplet loss(实际上文章的二作就是行人ReID的大牛~);
(3)最终各loss的权重采用的是各可学习的值,也就是网络自己决定用什么样的权重。
3. Summary & Discussion
文章标题是多目标跟踪,笔者的感觉更像是考虑到整个生产线,将检测、识别、跟踪融合到了一起,前段时间看新闻说,“2019年AI技术将开始全面落地”,通过这篇文章,是否可以看出,学术界已经开始慢慢关注工业界的实际生产,不再仅仅专注于刷榜,而是开始思考整个工业流程,将多个模块做融合了呢?
最后再结合实际生产,谈几点笔者认为的可投入使用的改动方案以及跟朋友交流得到的思考:
(1)triplet loss往往训练特别耗时,如果数据量重组,可以简单粗暴地改成普通交叉熵loss;
(2)文中多目标跟踪,只跟踪一个目标人别,就是行人,所以包围盒的分类只用了2A,也就是两类:行人和背景,如果想做人、车、等等,可以考虑多分类的方案;
(3)标注工作一定是非常费劲的,要区分每张图的每个目标,这里得考虑算法辅助标注;
(4)一个模型同时输出检测和识别的结果,也许训练会比较困难?
(5)自动学习loss的权重,可能实际并不好操作,网络可能最终会偏向到某一个loss上面去了。
jde多目标_PaperReadingGroup-14-实时多目标跟踪文章理解相关推荐
- jde多目标_华科开源多目标跟踪(MOT)实时新SOTA:FairMOT
加入极市专业CV交流群,与 10000+来自港科大.北大.清华.中科院.CMU.腾讯.百度 等名校名企视觉开发者互动交流! 同时提供每月大咖直播分享.真实项目需求对接.干货资讯汇总,行业技术交流.关注 ...
- 【深度学习】用 YOLO v5+DeepSORT,打造实时多目标跟踪模型
内容概要:目标跟踪作为一个非常有前景的研究方向,常常因为场景复杂导致目标跟丢的情况发生.本文按照跟踪目标数量的差异,分别介绍了单目标跟踪及多目标跟踪. 关键词:目标跟踪 计算机视觉 教程 目 ...
- 用 YOLO v5+DeepSORT,打造实时多目标跟踪模型
内容概要:目标跟踪作为一个非常有前景的研究方向,常常因为场景复杂导致目标跟丢的情况发生.本文按照跟踪目标数量的差异,分别介绍了单目标跟踪及多目标跟踪. 目标跟踪 (Object Tracking) 是 ...
- ByteTrack实时多目标跟踪
去年的1024我写了一篇FairMOT实时多目标跟踪,兜兜转转,一年过去了,最近FairMOT原作者发布了更快更强的ByteTrack,也就有了这篇文章,有种恍如隔世之感. 简介 ByteTrack是 ...
- jde多目标_《和平精英》PEL职业联赛S3赛季:DKG战队获第四周周冠军,JDE“逆风翻盘”...
昨日,<和平精英>PEL职业联赛S3赛季的常规赛完美收官,在最后一天的比赛中,DKG战队凭借完美的队内配合与精湛个人技术摘得第四周的周冠军,他们最终以56分的总成绩位居周积分总榜的第二名, ...
- yolov5在线检测目标检测网页实时识别python目标检测flask
yolov5在线检测目标检测网页实时识别python目标检测flask #!/usr/bin/env python from importlib import import_module import ...
- 【论文阅读 - YolTrack】YolTrack:基于MTL的自动车辆实时多目标跟踪和分割
本文2021.12发表于IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS,作者来自哈工大.本文的主要贡献在于提出了一种新的神经网络模型 ...
- 业界首个实时多目标跟踪系统开源
(图片由AI科技大本营付费下载自视觉中国) 作者 | CV君 来源 | 我爱计算机视觉(ID:aicvml) 相对业界研究比较多的单目标跟踪,多目标跟踪(Multi-Object Tracking,M ...
- CMU开源:价值百万美元的多目标人体关键点实时检测
相关文章:开源|2017 CVPR(Oral Paper):多目标实时体态估测 项目开源 主要内容介绍: OpenPose是一个利用OpenCV和Caffe并以C++写成的开源库,用来实现多线程的多人 ...
最新文章
- Linux怎么关闭ssh和ftp服务,linux ftp启用和停用及vsftpd安装 ssh 启用和停用命令及ssh的安装...
- 威胁报告:mDNS 反射式 DDoS 攻击
- maven + bat 实现快速编译打包模块代码
- ca证书 linux 导入_Linux CA证书服务器搭建
- python 自定义模块的发布和安装
- Linux学习-11月12日(Apache安装)
- 加载中_GIS地图在项目中的加载显示
- 【LeetCode笔记】221. 最大正方形(Java、动态规划、思路题)
- springboot使用thymeleaf模板引擎时出现org.xml.sax.SAXParseException的原因与解决办法
- xp升级windows7_微软大升级!Windows系统电脑将告别杀毒软件
- Photoshop 入门教程,处理图层「4」如何向多图层图像中添加更多图像?
- 少年,别再收藏文章了!
- Git(3):git clone远程GitHub仓库代码出现“Permission Denied (publickey)”问题
- 华为数通笔记-VRP
- java使用ffmpeg转码并上传视频
- js获取当前日期yyyymmdd
- 高清电脑壁纸2k图片,4k批量免费下载,壁纸打包下载,美女壁纸
- 使用cmd命令行查看wifi密码
- My Sixteenth Page - 四数相加 - By Nicolas
- 从财报看纳德拉上任两年:云服务是最大的突破