Not All Points Are Equal Learning Highly Efficient Point-based Detectors for 3D LiDAR Point Cloud

一 核心思想

为了降低内存和计算成本,现有的基于point的pipeline通常采用随机采样或FPS采样来逐步下采样输入点云,尽管并非所有的点对目标检测任务都同等重要。特别是,前景点在本质上比背景点对目标探测器更重要。基于此,本文提出了一种高效的single-stage point-based 3D detection——IA-SSD。

该方法的关键是利用两种可学习的、面向任务的、实例感知的down sample strategy来分层次地选择属于object的foreground point。此外,我们还引入了contextual centroid perception module来进一步估计精确的object center。最后,为了提高效率,我们按照只使用encoder-only的体系结构构建IA-SSD。

本文的方法中借鉴了3DSSD的框架,主要的贡献在于将每一层的采样策略进行了调整,让每次down sample采样中,前景点都占大多数。

具体框架如下图所示:

二 核心步骤

现有的point-based的检测器在其框架中通常采用与任务无关的采样方法,如随机采样或最远点采样。尽管对于降低内存/计算成本有效,但在渐进式下采样中,最重要的foreground point也会减少。此外,由于不同物体的大小和几何形状存在很大差异,现有的探测器通常针对不同类型的物体训练具有各种精心调整的超参数的单独模型。然而,这不可避免地会影响这些模型在实践中的部署。因此,本文的目标是:能否训练出一种基于单点的模型,这种模型能够高效地一次检测出多类目标。

基于此,本文提出了一种高效的单级检测器,通过引入instance-aware downsampling和contextual centroid perception module。如上图所示, IA-SSD采用了3DSSD中的特征提取架构。首先将输入的LiDAR点云输入到网络中提取point features,然后提出instance-aware downsampling,以逐步降低计算成本,同时保留信息丰富的foreground point。学习到的潜在特征进一步输入到contextual centroid perception module,生成proposal并回归最终的边界框。

由此本文主要有两个重点: instance-aware downsampling和contextual centroid perception module。

2.1 Instance-aware Downsampling Strategy

如上图所示,为了尽可能地保留foreground point,我们转向利用每个点的潜在语义,因为随着分层聚合在每个层中操作,学习到的点特征可能包含更丰富的语义信息。基于这一思想,我们提出了class-aware sampling和centroid-aware sampling两种面向任务的采样方法,将前景语义先验整合到网络训练pipeline中。

Class-aware sampling:就是在采样中,加入前景点的预测head,具体公式如下:

Centroid-aware sampling(只在training过程中被用到):这里就是在进行class-aware sampling时,考虑到距离object中心的点应该更被考虑到,因此使用了预测距离中心的权重head,具体公式如下:

这个也是本人想的一种预测距离中心的方法。

这样子就可以将得分的损失函数改为:

将soft point mask与foreground point的损失项相乘,使靠近中心的点具有更高的概率。注意,在inference过程中不再需要边界框,如果模型训练良好,我们只需保留下采样后得分最高的k个点。

经过上面的策略详解,我们的采样策略与其他策略对比如下所示:

2.2 Contextual Instance Centroid Perception

我们试图利用bounding box周围的上下文线索进行例如质心预测。具体来说,我们遵循VoteNet来显式预测到object中心的偏移量。(也就是进行聚集操作,如下图的VoteNet所示,就是用FPS选择出k个点然后对周围的点进行聚集操作。)

值得注意的是,在本文中,我们并不是仅仅使用边界框内的点或移位点来进行中心预测,我们手动扩展ground truth bounding box,或者按比例放大该框,以覆盖物体附近更多相关的上下文。利用落在扩展包围框内的采样点估计偏移量,然后进行偏移。

2.3 Centroid-based Instance Aggregation

2.4 End-to-End Learning

三 总结

本文提出的方法主要在速度上存在优势,在检测精度上还是没有达到SOTA。

【3D 目标检测】Not All Points Are Equal Learning Highly Efficient Point-based Detectors for 3D LiDAR Point相关推荐

  1. Not All Points Are Equal: Learning Highly Efficient Point-based Detectors for 3D LiDAR Point Clouds

    每日论文--CVPR2022目标检测 论文解读 论文解读 本文基于point_base的方法实现了高效的3D检测器IA-SSD,作者认为,使用传统的FPS方法会丢失大量前景点,导致检测recall下降 ...

  2. 三维目标检测论文阅读:VoxelNet: End-to-End Learning for Point Cloud Based 3D Object Detection

    VoxelNet: End-to-End Learning for Point Cloud Based 3D Object Detection 理解了PointPillars这篇文章后,看这篇文章就清 ...

  3. 基于激光雷达点云的3D目标检测算法论文总结

    作者丨eyesighting@知乎 来源丨https://zhuanlan.zhihu.com/p/508859024 编辑丨3D视觉工坊 前言  过去很多年激光雷达的车规标准和高昂价格是阻碍其量产落 ...

  4. CVPR2022论文速递(2022.3.22)!共25篇多篇3D目标检测

    整理:AI算法与图像处理 CVPR2022论文和代码整理:https://github.com/DWCTOD/CVPR2022-Papers-with-Code-Demo 欢迎关注: Transfor ...

  5. 【3D目标检测】SMOKE: Single-Stage Monocular 3D Object Detection via Keypoint Estimation

    目录 前提 概述 细节 网络结构 特征提取网络 检测头1:关键点检测 检测头2:3D参数回归 损失函数 前提 需要先了解下CenterNet [目标检测]Objects as Points 概述 本文 ...

  6. CaDDN:基于单目的3D目标检测新方法(CVPR2021)

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者丨元气满满的打工人 来源丨CV研习社 文章导读 导读:在自动驾驶的技术中,3D目标检测能够提更加丰 ...

  7. 汇总|3D目标检测文章(CVPR2020)

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 前言 今年CVPR20-paper-list前几天已经出了,所以这里做一点大致的综述介绍在CVPR20 ...

  8. 3D-VID:基于LiDar Video信息的3D目标检测框架|CVPR20

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 Brief paper地址:https://arxiv.org/pdf/2004.01389.pdf ...

  9. Det3D - 首个通用 3D 目标检测框架

    点击我爱计算机视觉标星,更快获取CVML新技术 本文转载自知乎,已获作者授权转载,请勿二次转载. (原文链接:https://zhuanlan.zhihu.com/p/101346137) 背景介绍 ...

最新文章

  1. C#读取数据库返回泛型集合 把DataSet类型转换为ListT泛型集合
  2. NET中的设计模式---单件模式
  3. 解决Mac app store更新时[newNUllResponse]的问题
  4. python语言格式化输出_Python | 格式化输出字符串
  5. java 相加的函数_Java8 Collectors求和功能的自定义扩展操作
  6. scala逻辑运算符的一览图和代码案例
  7. PHP的Postman使用
  8. STM32F1笔记(三)UART/USART
  9. homebrew长时间停在Updating Homebrew 这个步骤
  10. 我五年来都没来过 我的意志力飞涨。
  11. .aspx(或.asp)文件与.html(.htm)文件的区别与联系
  12. USRP_X310_Device_Recovery手册
  13. gateway跨域问题解决方法
  14. 论文笔记 DXSLAM: A Robust and Efficient Visual SLAM System with Deep Features
  15. 安装下载python的安装和配置
  16. 【Jupyter Notebook】在jupyter中使用数学公式
  17. 香港城大:首创3D打印磁控微型机器人技术,推动人体送药研究发展
  18. Ubuntu20.04下配置Anaconda3+NVIDIA 驱动+Cuda11.1+Cudnn8.0.5
  19. 第四章 安装centos与多重引导
  20. Cadence 如何创建元件库与元件

热门文章

  1. 巴比特 | 元宇宙每日必读:微软“工业元宇宙”业务再“开单”,川崎重工继亨氏、波音之后成为其新客户...
  2. 莫听穿林打叶声,2022年SSD行业回顾与展望
  3. SAP message no. 04202 用户 xxxx 没有访问计算机 xxx.xxx.xxx.xxx 的权限
  4. android 美团多渠道打包方案
  5. 2018互联网大厂秋招编程通关(二)
  6. 日记--javascriptApache Echarts
  7. idea Translation IP 地址无法访问
  8. C语言 复数四则运算
  9. 深腾8800型超级计算机,深网|中国超级计算机TOP100榜单:联想曙光各39套并列第一...
  10. 通过事例重温一下常见的 JS 中 15 种数组操作(备忘清单)