激光SLAM | SuMa++:基于激光雷达的语义SLAM
论文题目:SuMa++:Efficient LiDAR-based Semantic SLAM
可参考此文
一、摘要
可靠的高精度定位和建图是自动驾驶系统的关键环节。除了高精度的几何信息以外,地图中还应该包含语义信息,以为载体的智能行为提供依据。但在实际环境中,移动物体的存在会使建图过程变得更加复杂,因为它会污染地图并影响定位效果。在这篇文章里,我们在传统基于曲面建图(surfel based mapping)方法的基础上,增加语义信息的融合以解决上面提到的问题。语义信息的提取是通过神经网络完成的,该网络对点云中所有的点都给予类别标签,从而让我们在使用曲面建图时,得到的是带有标签的曲面。通过这种方法,不仅可以滤除动态物体,而且可以使用语义信息对里程估计进行约束,以提到地图精度。为了验证该方法的效果,我们使用KITTI数据集中的高速公路场景进行实验,结果表明,它的效果要优于传统的仅使用集合信息的方法。
二、主要贡献
1、对点云进行语义分割,根据语义信息识别动态物体,并在地图中去除。
2、把带有语义标签的物体进行数据关联,和几何信息一起建立约束关系,从而提高建图精度。
三、主要算法
1. 整体思路
本论文所提出的整体网络结构如下图所示,从图中我们可以看出该算法的主要流程:
1)通过网络对点云进行语义分割
2)使用漫水填充(flood-fill)方法消除错误的类别标签
3)使用滤波器进行动态物体检测,并移除动态物体
4)建立带语义信息约束的ICP模型,优化里程精度
2. 语义分割
语义分割使用的是RangeNet++方法,它的主要内容在另一篇论文里,该论文并没有对这个方法进行太多的改进,下图是RangeNet++的网络结构图
3. 漫水填充
由于网络对点云进行的语义分割必然包含正确分类和错误分类,而这里面的错误会对后续环节产生不好的影响,因此有必要对其进行消除。这一环节的主要流程如下图所示。
上图中左侧是右侧图中虚线框方法的部分,先对(a)中的错误识别结果进行剔除,得到(b),然后利用周围的标签点云对他进行填充,得到©。最后(d)中显示的是©对应的深度图。
4. 移除动态物体
动态物体的识别是根据物体在同一位置出现的概率实现的。具体来讲,就是说如果在这一帧中,某个位置出现了物体,在下一帧中,它还在,如果连续很多帧它都出现在同一个位置,那么它就是静止的,反之,在每一帧中检测到的位置都发生变化,那么它就是移动的。当然,此处位置指的是地图中的位置,而不是相对于当前帧点云的位置。上面是为了方便理解采用的通俗的解释,实际算法实现是用下面的公式这个公式就是用来计算概率的。
如果有对cartographer比较熟悉的读者,会发现这个公式其实和cartographer移除动态物体的公式很像,其实他们的核心思想确实是一样的。
5. 基于语义信息的ICP
我们知道ICP对两帧点云匹配其实就是让两帧点云对应点的距离达到最小,越小说明位姿估计的越准。但它仅使用几何信息,鲁棒性不是很好。此处作者为了改进这一问题,把语义信息也加入了ICP的数据关联当中,每一个物体对应一个关联关系,进行位姿估计时,除了点云要尽量接近,带语义标签的各个物体也要尽量接近。
三、实验效果
作者在KITTI数据集上进行了测试,而且专门挑的移动物体特别多的路段,实际效果如下图所示。
在上图中,(c)是真实的环境,这里的图片只是为了向作者展示环境里有什么,算法并没有用到图片信息。(a) 和 (b) 分别是不结合语义信息和结合语义信息建立的地图,从图中明显可以看出,不使用语义信息时,周围的车辆造成的拖尾现象就特别严重。但我们同样也发现了另一个现象,就是在考虑语义信息以后,虽然没有拖尾,但是车辆仍然在里面,也就是说如果建图的时候有堵车,那么公路的地图中仍然会有车辆,而这对地图来讲也是不好的。所以这样看,不仅需要移除动的物体,而且有必要移除一些可能动的物体。
四、结论
本文提出了一种基于语义信息的激光SLAM系统,通过语义分割,识别出周围环境中的物体,以物体为单位,构建和带有语义约束的ICP模型,提高了定位的稳定性,同时对动态物体进行了识别并剔除,提高了地图的质量。
激光SLAM | SuMa++:基于激光雷达的语义SLAM相关推荐
- 面向动态环境基于点的语义SLAM系统
点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者:robot L | 来源:知乎 https://zhuanlan.zhihu.com/p/133 ...
- SuMa++: 基于激光雷达的高效语义SLAM
点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 编辑丨当SLAM遇见小王同学 摘要 可靠.准确的定位和建图是大多数自动驾驶系统的关键组件.除了关于环境 ...
- SLAM综述:激光雷达与视觉SLAM
第一节概述. 第二节讲述激光SLAM:激光传感器,开源系统,深度学习的应用. 第三节讲述视觉SLAM:相机传感器,开源系统,视觉惯性里程计,深度学习的应用. 第四节讲述激光雷达与视觉的融合. 最后展望 ...
- 用于自动泊车的鸟瞰图的边缘线的语义SLAM系统
文章:Hybrid Bird's-Eye Edge Based Semantic Visual SLAM for Automated Valet Parking 作者:Zhenzhen Xiang, ...
- CamVox:一种低成本、高精度的激光雷达辅助视觉SLAM系统
标题:VCamVox: A Low-cost and Accurate Lidar-assisted Visual SLAM System 作者:Yuewen Zhu, Chunran Zheng, ...
- 【开源方案共享】VDO-SLAM:基于视觉的动态SLAM感知系统
点云PCL免费知识星球,点云论文速读. 标题:VDO-SLAM: A Visual Dynamic Object-aware SLAM System 作者:Jun Zhang , Mina Henei ...
- 从零入门激光SLAM(一)——什么是SLAM
大家好呀,我是一个SLAM方向的在读博士,深知SLAM学习过程一路走来的坎坷,也十分感谢各位大佬的优质文章和源码.随着知识的越来越多,越来越细,我准备整理一个自己的激光SLAM学习笔记专栏,从0带大家 ...
- (汇总篇)语义SLAM相关开源方案| 全球优秀作者与实验室 | SLAM学习资料整理
目录 1 开源方案 1.1 Geometric SLAM (26项) 1. PTAM 2. S-PTAM(双目 PTAM) 3. MonoSLAM 4. ORB-SLAM2 5. DSO 6. LDS ...
- 八种常用激光雷达和视觉SLAM算法的评估与比较
文章:Evaluation and comparison of eight popular Lidar and Visual SLAM algorithms 作者:Bharath Garigipati ...
最新文章
- docker 删除容器_Docker使用命令和技巧
- 一段处理百分数的js代码
- 全球首个软硬件推理平台 :NVDLA编译器正式开源
- Markdown设置字体大小、颜色...,CSDN博客编写设置字体大小、颜色、粗细。字体,文字背景设置。
- 新开两场构建服务治理框架的直播分享
- php日志缓存,php – Symfony和Docker – 缓存和日志目录权...
- 创建 shell 脚本文件
- Drools实战-个人所得税计算器
- PDF页眉页脚怎么去掉,页眉页脚删除方法
- Android 编写WiFi探针,一种WiFi探针路由器的制作方法
- 帝国CMS7.5忘记后台密码怎么找回
- 函数防抖(debounce)和节流(throttle)在H5编辑器项目中的应用
- ZOJ1516 Uncle Tom's Inherited Land(二分图最大匹配)
- php微信网页不缓存,微信浏览器取消缓存的方法
- 主题模型LDA、NMF、LSA
- 【图像去噪】空域+频域滤波图像去噪【含GUI Matlab源码 914期】
- python有哪些细节描写_细节描写的句子有哪些
- Mui框架的遇到的问题记录
- [c++]project reference and link
- ORACLE甚而,PL/SQL基础