在目标检测方法中,基于关键点的方法会检测出大量不正确的边界框,这是由于没有对裁剪区域进行进一步的检查。本文提出了一种有效的解决方案,以最小的成本检测裁剪区域。本框架基于CornerNet,名为CenterNet,用一个三元组来表示一个目标,而不是一对点,提高了精准率和召回率。设计了两个定制的模块,级联corner pooling和center pooling,定制的模块,称为级联角池和中心池,它们分别发挥了丰富左上角和右下角收集的信息和在中心区域提供更可识别的信息的作用。

1、anchor base的缺陷

(1)需要大量设计大量的anchor,耗费资源,并且预设anchor的数量,大小,尺寸是困难的。
(2)anchor通常没有和ground-truth boxes对齐,这就加剧了分类任务的困难性。
为了克服这种困难,提出了基于关键点的检测方法CornerNet。Corner net检测目标的左上点和右下点,但是其性能受目标的全局信息限制。也就是说,每个目标是由一对角点表示的,因此该方法对检测目标的边界是敏感的,同时不知道该将那一对关键点分组为一对。因此经常产生一些不正确的边界框,大多数可以用互补信息,比如纵横比过滤掉
为了解决这个问题,我们为CornerNet配备了感知每个建议区域内的视觉模式的能力,以便它能够自己识别每个边框的正确性。
直觉是如果预测的候选框与真实边界框有高IOU值,然后,中心键点在其中心区域被预测为同一类的概率很高。因此,在推理过程中,在将候选框生成为一对角键点之后,通过检查是否有同一类的中心键点位于其中心区域内来确定候选框是否确实是一个对象。
Cernert Pooling用于预测中心关键点,帮助中心关键点获取更丰富的目标视觉特征,可以更加容易的感知候选框的中心部分。通过在一个用于预测中心关键点的特征图上得到中心关键点的水平和垂直方向的最大求和响应来实现这一点。
级联corner pooling,它使得原始corner pooling模块具有感知内部信息的能力。通过在特征图上求目标的边界和内部是最大求和相应来实现。

2、Cornert存在的缺点

Cornert的错误率在Iou=0.5时达到32.7%,在检测小目标时达到60.3%,这有可能是因为CornerNet看不见边界框内部的区域。

3、将目标检测当作关键点的三元组


用一个中心点和一个角点来表示目标。
具体来说,在CornerNet的基础上嵌入了中心关键点的热图,并预测了中心关键点的偏移量。 然后,利用cornerNet中提出的方法生成顶k包围盒。 然而,为了有效地过滤掉不正确的包围框,利用检测到的中心关键点并采用以下步骤:
(1)根据它们的分数选择top-k中心关键点;
(2)使用相应的偏移量将这些中心关键点重新映射到输入图像;
(3)为每一个包围框定义一个中心区域,并且检查中心区域是否包含中心关键点。注意,检查的中心关键点的类标签应该与包围框的类标签相同。
(4)如果在中心区域检测到中心关键点,将保留包围框。 包围框的分数将被这三个点的平均分数所取代,即左上角、右下角和中间关键点。 如果在其中心区域中没有检测到中心关键点,则边界框将被删除。
包围框中心区域的大小影响检测效果。中心区域较小召回率低,中心区域大精度较低。所以本文提出一个尺度感知的中心区域,自适应包围框的大小。尺度感知的中心区域倾向于为一个小的包围盒生成一个相对较大的中心区域,而为一个大的包围盒生成一个相对较小的中心区域。
实际包围框与中心区域(c)应该满足:

其中n是奇数,决定中心区域的尺度。

4、丰富中心和角点的信息

(1)center pooling:物体的集合中心不一定传达可识别的信息。所以本文提出center pooling去捕获更丰富和可识别的视觉信息。backbone输出特征图,在其水平方向和垂直方向上找到最大值并将它们相加。figure 4(a)
(2)级联corner pooling: 角通常在物体之外,缺乏局部的外观特征。corner pooling是在边界方向上找到最大值,从而确定角。但是其使得角对边敏感,为了解决这个问题,本文让corners看见目标的视觉信息。级联corner pooling的原理图figure4©。 它首先沿边界查找边界最大值,然后沿边界最大值2的位置向内查找内部最大值,最后将两个最大值相加。 通过这样做,角点获得了边界信息和对象的视觉模式。

图5(a)显示了中心池模块的结构。 要在一个方向上取一个最大值,例如水平方向,我们只需要串联连接左池和右池。 图5(B)显示了级联顶角池模块的结构。 与角网[20]中的上角池相比,我们在上角池之前添加了一个左角池。

5、训练和推理

(1)训练:训练损失:

(2)推理:

CenterNet: Keypoint Triplets for Object Detection相关推荐

  1. 论文精读——CenterNet :Keypoint Triplets for Object Detection

    论文地址:https://arxiv.org/abs/1904.08189 论文代码:https://github.com/Duankaiwen/CenterNet 发布时间:2019.4.17 发布 ...

  2. 论文阅读:CenterNet: Keypoint Triplets for Object Detection(CVPR2019)

    论文地址:https://arxiv.org/abs/1904.08189 github实现:https://github.com/Duankaiwen/CenterNet 摘要 目标检测中,基于关键 ...

  3. CenterNet: Keypoint Triplets for Object Detection ----- 论文翻译理解

    Abstract 在对象检测中,基于关键点的方法经常遇到大量不正确的对象边界框,这可能是由于缺少对裁剪区域的额外检查.本文提出了一种有效的解决方案,以最小的代价探索每个裁剪区域内的视觉模式.在一个具有 ...

  4. CenterNet: Keypoint Triplts for Object Detection 论文阅读笔记

    论文名称:CenterNet: Keypoint Triplts for Object Detection 作者:Kaiwen Duan & Song Bai等 论文链接:https://ar ...

  5. CenterNet:Keypoint Triplets for Object Detection(中文版)

    摘要 在对象检测中,基于关键点的方法通常用于处理大量不正确的对象边界框,这是由于缺少对裁剪区域的额外查看.本文提出了一种有效的解决方案,以最小的代价在每个裁剪区域内实现视觉模式的求解.我们的框架建立在 ...

  6. Dynamic Head: Unifying Object Detection Heads with Attentions 阅读

    Abstract 这里就是说在目标检测领域,很多工作都想提高检测头的性能,这篇文章提出了动态头,也就是Dynamic Head,来将检测头和注意力(Attention)结合.在尺度(scale-awa ...

  7. Object Detection(目标检测神文)(二)

    文章目录 [CVPR2019] Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression ...

  8. 【3D目标检测】SMOKE: Single-Stage Monocular 3D Object Detection via Keypoint Estimation

    目录 前提 概述 细节 网络结构 特征提取网络 检测头1:关键点检测 检测头2:3D参数回归 损失函数 前提 需要先了解下CenterNet [目标检测]Objects as Points 概述 本文 ...

  9. 【目标检测论文阅读笔记】Feature-Enhanced CenterNet for Small Object Detection in Remote Sensing Images

    Abstract: 与 anchor-based基于锚点的检测器相比,anchor-free无锚点检测器 具有灵活性和较低计算复杂度的优点.然而,在复杂的遥感场景中,受限的几何尺寸.目标的弱特征 以及 ...

最新文章

  1. Ant Design 入门-参照官方文档使用组件
  2. vue与php通过axios进行数据交互
  3. Python开源爬虫项目代码:抓取淘宝、京东、QQ、知网数据--转
  4. 2019第十届蓝桥杯比赛总结(B组c/c++)
  5. 洛谷 P1200 [USACO1.1]你的飞碟在这儿Your Ride Is He…【字符串+模拟】
  6. 将JavaScript集成到QML中
  7. Oracle10g数据库归档与非归档模式下的备份与恢复
  8. 多线程顺序交替打印ABCD
  9. [开源]C#中开源软件大汇总(外国的)
  10. php学习总结,PHP学习的技巧和学习的要素总结
  11. ubuntu-kylin16.04搭建lamp环境。
  12. linux TUN 虚拟网卡设备
  13. hutool工具私人学习笔记
  14. 【ISO】Windows10系统ISO镜像怎么从微软官网下载?
  15. web前端总结之文本超出显示省略号
  16. 机器学习 识别图片人物动作_一键学习人物识别说明
  17. vite+vue3+TS项目引入antd-vue的问题记录
  18. (原创)报考计算机博士之前应该注意的几个问题---写给应届硕士毕业生
  19. 数据分析 - 跨境电商爬虫成长记 之 第三篇:完整的爬虫工作环节有哪些
  20. 前端Bani Yas

热门文章

  1. 苹果关闭自动更新_苹果手机一定要关闭的5大功能!省电不止一倍!一天一充就够了...
  2. asp.net967-基于.NET的健身会所管理系统
  3. 2021-湖湘杯-Web
  4. MAC电脑如何播放.SWF文件
  5. 入网许可迟迟不发,iPhone 6入华或拖到10月底
  6. 教你使用CDR变形工具制作螺旋绚丽特效
  7. mysql 二进制 最大长度_mysql 二进制日志后缀数字最大为多少
  8. linux zip命令不存在,Linux压缩命令:zip命令详解
  9. Element Plus 实例详解(一)___安装设置
  10. android指纹识别真机,魅族15真机入网工信部!这就是黄章大招