Abstract

在这项工作中,我们消除了对 3D 点云进行手动特征工程的需要,并提出了 VoxelNet,这是一种通用的 3D 检测网络,它将特征提取和边界框预测统一到一个单一的阶段、端到端的可训练深度网络中。

Specifically,VoxelNet 将点云划分为等间距的 3D 体素,并通过新引入的体素特征编码(VFE)层将每个体素内的一组点转换为统一的特征表示。

Introduction

手动设计选择引入了信息瓶颈,阻碍了这些方法有效利用 3D 形状信息和检测任务所需的不变性。图像识别和检测 任务的重大突破是由于从手工制作的特征转向机器学习的特征。

RPN是一种高度优化的算法,用于有效的目标检测,但是这种方法要求数据稠密并以tensor结构组织,但LiDAR点云不是如此。本文缩小了用于3D检测任务的点集特征学习和RPN之间的差距。

VoxelNet以端到端的方式同时从点云中学习特征并预测准确的 3D 边界框。设计了VFE(voxel feature encoding)将逐点特征与局部聚合特征相结合,实现体素内的点间交互。堆叠多个 VFE 层允许学习用于表征局部 3D 形状信息的复杂特征。VoxelNet 将点云划分为等间距的 3D 体素,然后通过VFE对体素编码,然后3D卷积进一步聚合局部体素特征,将点云转换为高维体积表示。最后,RPN 使用体积表示并产生检测结果。

Related Work

当有丰富而详细的 3D 形状信息可用时,这些手工制作的特征会产生令人满意的结果。然而,它们无法适应更复杂的形状和场景,也无法从数据中学习所需的不变性,导致在

VoxelNet 阅读相关推荐

  1. VoxelNet阅读笔记

    作者:Tom Hardy Date:2020-02-11 来源:VoxelNet阅读笔记

  2. 超详细的3D视觉学习路线汇总

    微信公众号推荐 [3D视觉工坊简介] 公众号[3D视觉工坊],致力于3D视觉算法.SLAM算法.三维重建.点云处理.深度学习.目标检测.语义分割.自动驾驶感知算法等领域的技术传播,注重内容的原创分享和 ...

  3. 汇总 |计算机视觉系统学习资料下载

    微信公众号推荐 关注公众号 后台回复 「资料」,即可下载 计算机视觉干货资料,涉及相机标定.三维重建. 立体视觉.SLAM.深度学习.点云后处理.姿态估计.多视图几何.多传感器融合等方向 [计算机视觉 ...

  4. 3D视觉学习路线汇总

    微信公众号推荐 [3D视觉工坊简介] 公众号[3D视觉工坊],致力于3D视觉算法.SLAM算法.三维重建.点云处理.深度学习.目标检测.语义分割.自动驾驶感知算法等领域的技术传播,注重内容的原创分享和 ...

  5. 汇总|3D视觉系统学习资料下载

    微信公众号推荐 关注公众号 后台回复 3D视觉  即可下载 3D视觉相关资料干货,涉及相机标定. 三维重建.立体视觉.SLAM.深度学习.点云后处理.多视图几何等方向 [3D视觉工坊简介] 公众号[3 ...

  6. 三维目标检测论文阅读:VoxelNet: End-to-End Learning for Point Cloud Based 3D Object Detection

    VoxelNet: End-to-End Learning for Point Cloud Based 3D Object Detection 理解了PointPillars这篇文章后,看这篇文章就清 ...

  7. 论文阅读笔记 | 三维目标检测——VoxelNet算法

    如有错误,恳请指出. 文章目录 1.背景 2. 网络结构 2.1 体素特征表示 2.2 卷积特征提取 2.3 RPN网络 3. 实验结果 paper:<VoxelNet: End-to-End ...

  8. 3D目标检测论文阅读摘要

    3D目标检测论文阅读摘要 2D Object Detection 的研究已经非常成熟了,代表作品有RPN系列的FasterRCNN,One Shot系列的YOLOv1-YOLOv3,这里推荐一个2D ...

  9. 【论文阅读】【综述】3D Object Detection 3D目标检测综述

    目录 写在开头 3D Object Detection 相关博客: Sliding window Vote3Deep: Fast Object Detection in 3D Point Clouds ...

最新文章

  1. 在当当买了python怎么下载源代码-Python爬取当当网APP数据
  2. python用raise手动抛出异常
  3. 通过案例对 spark streaming 透彻理解三板斧之一: spark streaming 另类实验
  4. iptv直播_全球IPTV高清直播网络电视+4K频道
  5. vue 移动到图片浮动_基于Vue实现拖拽升级(九宫格拖拽)
  6. java 模拟电梯_java模拟电梯运行简单实现,swing界面
  7. {Azure} 常用链接
  8. 经济数据预测 | Python实现ELM极限学习机股票价格时间序列预测
  9. GZH逸佳君:照片杂色太可怕,谁丑谁尴尬:送你超实用PS降噪插件,1秒变高清
  10. QQ互联本地测试【QQ互联第一步】
  11. 思科C9500交换机介绍及光模块解决方案
  12. 自动适配跳转电脑PC端和手机WAP端
  13. 公司-摩拜单车:摩拜单车
  14. 无法启动此程序因为计算机丢失msvcr110.dll,Win7运行程序提示计算机中丢失msvcr110.dll如何解决...
  15. 校园招聘Offer、三方协议、两方协议、劳动合同到底都是什么?怎样避免被坑?
  16. 父母脾气暴躁对孩子有哪些影响
  17. 华为手机忘记密码如何解开,有什么相关教程吗
  18. 能够破解网站禁止复制的插件:Enable Copy
  19. 软件工程的先驱 女软件工程师Margaret Hamilton
  20. 无线传感器网络(特点,挑战和应用)

热门文章

  1. (PC+WAP)织梦模板财经新闻资讯类网站
  2. python作业网站_怒刷python作业-WEB资讯专栏-DMOZ中文网站分类目录-免费收录各类优秀网站的中文网站目录....
  3. 失业半年,HR女友教我简历作假顺利入职!
  4. 设计模式六大原则-java复读记录
  5. 制作启动盘(带数据,不用格式化)
  6. Verilog数字系统设计(夏宇闻)—课后思考题记录(上)
  7. 【数据】2000-2020Landscan Global Population Database(全球人口分布数据集-1km)下载教程
  8. 使用正则表达式 匹配 HTML 标签内的内容
  9. vue echarts柱状图 隐藏坐标轴刻度线等 横向显示百分比
  10. 1.elasticsearch文档存储(保存|修改|删除)