SECOND: Sparsely Embedded Convolutional Detection

重庆大学,输变电设备与系统安全国家重点实验室,2018,KITTI


总结

基于体素划分的3D卷积网络可以较好的处理lidar信息,但是有推理速度慢和朝向估计的性能差的不足。

本文贡献:

  1. 提出了一种改进的稀疏卷积网络,应用于基于LiDAR的目标检测任务中,显著提高了训练和推理的速度
  2. 引入新的朝向角度损失函数,较其他方法有更好的性能
  3. 对仅基于LiDAR的学习问题引入新的数据扩增方法,提高了收敛速度和性能

SECOND Detecter:


提出的SECOND检测模型由3部分组成:体素网格特征提取器,稀疏卷积层(中间层),RPN网络

1. 体素网格特征提取器:

先对点云做grouping,选取特定范围内的点作为特征提取器的输入

先对原始点云进行体素网格划分,随后利用 VFE 体素特征提取网络提取每个体素的特征

2. 稀疏卷积中间层

体素化之后大约会产生5k~8k个体素以及约0.005的稀疏度,直接运用3D卷积将消耗巨大的计算资源和时间.这里作者采用了submanifold convolution, 通过输入数据的稀疏性限制输出的稀疏性,从而极大减少了后续卷积操作的计算量。

本文使用的稀疏卷积特征提取网络包含了稀疏卷积层(由黄色表示), submanifold convolution(白)以及稀疏到稠密的转换层(红)。

RPN:


使用类似SSD的网络作为RPN,由3个stage组成,即(conv * k + BN + ReLU) * 3,然后将每个stage的输出反卷积上采样连接成一个特征图。最后使用三个1* 1的卷积得到类别,偏移和方向。

Loss

新的角度损失回归函数Sine-Error:

对比voxel net的损失函数:

貌似新的损失函数多了求sin()的步骤,这样的好处有:

  • 解决了朝向为0和Pi的混淆问题
  • 天然地根据角度偏移函数来模拟iou

此外还添加了朝向分类器,向前为正,向后为负

除此之外,作者还提出了一种数据增强方法来加速训练的收敛。从训练集的ground truths中采样形成一个数据库,在训练过程中随机选择数据库中的几个样本并且引入到当前的点云中,为了避免矛盾情况的出现还需要进行碰撞检测。作者还对样本引入了随机的角度噪声,最后还对全局的点云进行小幅度的旋转和缩放。

性能测试

3D detection:

实验分析和个人观点:

SECOND速度快,在基本接近实时的情况下达到了与SOTA相近的精度。在大目标检测中性能优越,对于小目标检测则不如较重的网络。点云数据对小目标不敏感是天生的缺点,目前的应对策略是融合2D信息,但是会降低检测速度。原文中讲到:

“However, the promising aspect of this finding is that if it is possible to use information from such images, unrelated points can simply be filtered and locations of objects can be easily determined based on 2D detection results, which should make this problem easy to eliminate”

或许可以采用 稀疏卷积的点云检测网络 + 附加的2D小目标检测RPN 的结构
即:设计一种专门用来检测小目标的2D检测器,很轻速度非常快,这样只需要在最后3D检测RPN的输出上加上2D检测器的输出就可以了。

论文笔记 : SECOND: Sparsely Embedded Convolutional Detection相关推荐

  1. 论文阅读 SECOND:Sparsely Embedded Convolutional Detection

    标题:SECOND:Sparsely Embedded Convolutional Detection 作者:Yan Yan,Yuxing Mao,and Bo Li 来源:sensors 2018 ...

  2. SECOND: Sparsely Embedded Convolutional Detection 论文笔记

    SECOND: Sparsely Embedded Convolutional Detection 论文链接: https://www.researchgate.net/publication/328 ...

  3. 【论文阅读】SECOND: Sparsely Embedded Convolutional Detection

    论文链接: https://www.researchgate.net/publication/328158485_SECOND_Sparsely_Embedded_Convolutional_Dete ...

  4. 【3D目标检测】SECOND: Sparsely Embedded Convolutional Detection论文解读(2018)

    1. 为什么要做这个研究(理论走向和目前缺陷) ? VoxelNet这种直接对点云进行特征提取而非手工设计特征的3D检测算法效果还行但是很慢.以前的方案朝向预测不准. 2. 他们怎么做这个研究 (方法 ...

  5. SECOND: Sparsely Embedded Convolutional Detection

    Abstract 基于LiDAR或基于RGB-D的目标检测被用于从自动驾驶到机器人视觉的众多应用中.一段时间以来,基于体素的3D卷积网络在处理点云LiDAR数据时被用于增强信息的保留.然而,问题仍然存 ...

  6. 【3D目标检测】SECOND: Sparsely Embedded Convolutional Detection

    目录 概述 细节 网络结构 稀疏卷积 方向分类 损失函数 概述 首先,本文是基于点云,并且将点云处理成体素的3D目标检测网络,提出的SECOND可以看做是VoxelNet的升级版. 提出动机与贡献 V ...

  7. (2018, sensors) SECOND: Sparsely Embedded Convolutional Detection

    paper: https://www.mdpi.com/1424-8220/18/10/3337 code: https://github.com/traveller59/second.pytorch ...

  8. 论文笔记-DEC (Deep Embedded Clustering)

    论文笔记-DEC (Deep Embedded Clustering) 知识点1.将聚类的度量参考T-SNE中的t-分布,将聚类的度量转换成一个概率值(软分配,qij 表示将样本 i 分配给 j 簇的 ...

  9. [论文笔记] Line-CNN: End-to-End Traffic Line Detection With Line Proposal Unit

    [论文笔记] Line-CNN: End-to-End Traffic Line Detection With Line Proposal Unit IEEE TITS 2019 YangJian 简 ...

最新文章

  1. 计算机在幼儿园美术区域的应用,让幼儿在美术区域活动中快乐成长!
  2. java.lang.IncompatibleClassChangeError: Found interface org.apache.poi.util.POILogger, but class was
  3. linux/android 脚本相关
  4. Spring Cloud Alibaba源码 - 22 Feign 源码解析
  5. JavaScript的一些小技巧(转)
  6. 修改服务器的AJP监听地址,修改服务器的AJP监听地址
  7. Rust: 属性(attribute)的含义及文档大全
  8. java isprime函数,Java - isPrime函数
  9. 均价 和 最新价格 是啥意思 什么是MACD DIFF DEA 指标?
  10. 用重合图片去计算网络的峰值分类准确率
  11. 相机对焦、标定等近期学习
  12. 阿里飞冰(Iceworks)入门和飞冰是干什么的
  13. 浏览器搜索去除广告项
  14. Legolas工业自动化平台入门(三)交互事件响应动作
  15. linux用户和用户配置文件(nobody)
  16. Python 的类(菜鸟教程)
  17. 测试未来老公的样子软件,你的未来老公是哪一型?
  18. moonseo:教你发最有效果的外链,菜鸟必学(二)
  19. 5G,会消灭电视吗?
  20. c# https请求忽略证书验证_c# https绕过证书

热门文章

  1. 非CS专业小硕的机器学习/数据挖掘岗位秋招经验
  2. Python的10种谋生方法,你们都知道了吗?
  3. Java之协变返回类型理解和简单实例
  4. Linux---scp、cp命令
  5. 天气预报 接口数据获取
  6. 3D游戏建模师到底做什么工作?使用哪些软件?就业前景如何?该选择什么方式学习游戏建模?
  7. Graphviz - 生成smc 的.sm文件对应的工作流程图
  8. RS232转PROFIBUS DP总线桥使用方法远创智控
  9. CC2540 使用BTool
  10. linux 服务器之间共享目录