AAAI 2023 | 腾讯提出THMA:创建高精地图标注的腾讯高精地图AI系统
点击下方卡片,关注“CVer”公众号
AI/CV重磅干货,第一时间送达
点击进入—>【计算机视觉】微信技术交流群
作者:Iroh | (已授权 源:知乎)编辑:CVer
https://zhuanlan.zhihu.com/p/607546915
如今,自动驾驶汽车技术日趋成熟,对于其驾驶安全的需求也越来越高,高精地图(HD Map)是一种使用激光传感器采集的厘米级地图,可为自动驾驶系统提供车辆周围静态环境信息的精确描述,但是标注高精地图需要消耗大量的人力资源。为了减轻人工标注的负担,国内的图商近期已经开始部署人工智能算法来对高精地图进行预标注。今天向大家介绍的就是这个领域最新公开的一篇文献,作者来自工业界,是腾讯地图高精地图团队,他们站在业界的角度介绍了高精地图赛道自动标注技术已被部署的计算机视觉算法和潜在的研究方向,论文已经被AAAI / IAAI 2023接收,并获得IAAI-23 人工智能应用创新奖。
论文标题、作者信息:
收录会议:AAAI 2023 / IAAI 2023
论文链接:https://arxiv.org/abs/2212.11123
引用:Tang, Kun, et al. "THMA: Tencent HD Map AI System for Creating HD Map Annotations." Proceedings of the AAAI Conference on Artificial Intelligence. 2023.
在本文中,腾讯地图高精地图团队介绍了高精地图的发展历史,传统人工标注流程以及高精地图包含的交通信息标注。相比传统地图,高精地图可以为自动驾驶提供永久性的道路元素信息,例如带注释的3D车道类型,车道线类别等,与实时道路图像相比,高清地图为自动驾驶车辆提供离线厘米级定位服务和重要的交通场景先验知识,以避免自动驾驶系统运行时的环境干扰。
高精地图自动化制作过程包含四个步骤:数据收集、后端自动化、地图制作和地图检验、地图编译和地图发布。数据收集来自采集车上的传感器:GPS、IMU、LiDAR和摄像头。GPS和IMU提供精确的轨迹定位。LiDAR是高精地图最重要的传感器,可收集厘米级精度的物体位置信息,摄像头则用于采集RGB图像,用于标记高精地图数据的属性。传感器采集的原始点云和图像数据被传输到点云融合和自动标注系统,由人工智能和计算机视觉分析技术组成,用于点云和图像的预标记。随后,点云和预标记数据由人工验证,编译后进行发布。
腾讯的THMA系统主架构可以被理解为分而治之的AI算法处理,它可以识别 3D 多扫描融合点云、2.5D BEV 图像和 RGB 图像中的物体。3D 检测算法自动标记多扫描融合点云中的 3D 点(用于交通信号灯、电线杆、隧道和交通标志)和线(用于障碍物和路缘石)。2.5D 分割算法检测多通道 BEV 图像上的车道标记等地面元素。二维分割算法检测其他属性,例如 RGB 图像中的车道标记颜色。所有生成的注释都被合并到最终的高精地图产品中。
1. 蒸馏学习解决点云分割问题
THMA为 3D 点云分割识别构建了双训练路径。路径一是基于3D CNN的3D物体检测的基准模型,包括点特征提取模块、点到体素转换模块、编码器-解码器模型等。基准模型生成的细化Ground Truth与原始Ground Truth相结合, 然后用作路径二的监督目标。
2. 自监督、弱监督学习利用海量未标注的3D点云、BEV数据
由于需要构建一个数万公里道路场景的高精度地图,其中包含各种复杂的场景。为了提高模型的泛化能力,THMA使用流行的自监督训练方法,例如Contrastive Learning和Masked Learning,从超过 200,000 公里的点云数据中生成了数百万张 BEV 图像来训练我们的自监督网络。其基本结构是和Masked Autoencoder相似的深度编码器和轻量级解码器。对于Masked Learning任务,未被掩蔽的patch序列输入编码器,有解码器处理可学习的已屏蔽标记以进行BEV图像修复。
3. 主动学习提高高精地图生产收益
相较于传统的HD Map制作流程,THMA 系统引入了端到端主动学习 AI 系统。使用有限的人工标记数据预训练模型,然后借助模型生成剩余数据的伪标注,由人工进行验证筛选,更新后的数据由模型重新训练,通过多次循环实现端到端主动学习。
总结
腾讯的THMA从2021年开始部署,功能强大,每天可以生成30,000公里的高精地图,服务于1000多名地图数据标注技术员。它相当高效,可以完成高精地图标注90%的工作量,与纯人工标记相比,系统速度提高了 10 倍以上。THMA是迄今为止世界上最大的自动驾驶相关数据自动化标注系统之一。核心算法通过主动学习,已经基本实现了全自动标记和迭代化重复更新,与现有的手动标注技术相比,节省了大量时间和成本。
在未来的工作中,THMA计划将现有的集中于道路要素检测的系统扩展到更复杂的3D场景标记,进而重建现实世界的不同场景。同时将利用主动学习迭代和增量开发来进一步提高模型的稳定性和泛化能力。
以上内容为论文的简要介绍,详细内容请参考原文。
点击进入—>CV微信技术交流群
CVPR/ECCV 2022论文和代码下载
后台回复:CVPR2022,即可下载CVPR 2022论文和代码开源的论文合集
后台回复:ECCV2022,即可下载ECCV 2022论文和代码开源的论文合集
后台回复:Transformer综述,即可下载最新的3篇Transformer综述PDF
目标检测和Transformer交流群成立
扫描下方二维码,或者添加微信:CVer222,即可添加CVer小助手微信,便可申请加入CVer-目标检测或者Transformer 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer等。
一定要备注:研究方向+地点+学校/公司+昵称(如目标检测或者Transformer+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群▲扫码或加微信号: CVer222,进交流群
CVer学术交流群(知识星球)来了!想要了解最新最快最好的CV/DL/ML论文速递、优质开源项目、学习教程和实战训练等资料,欢迎扫描下方二维码,加入CVer学术交流群,已汇集数千人!▲扫码进群
▲点击上方卡片,关注CVer公众号
整理不易,请点赞和在看
AAAI 2023 | 腾讯提出THMA:创建高精地图标注的腾讯高精地图AI系统相关推荐
- 讲者招募 | 招募 AAAI 2023 一作华人讲者啦!
点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! AI TIME开始招募 AAAI 2023 一作华人讲者啦!!! 我们欢迎各位讲者来AI TIME分享您被 AAAI 2023录用的工作 ...
- AAAI 2023 | 腾讯优图实验室16篇论文入选,含多标签分类、姿态估计、目标检测、HOI、小样本学习等研究方向...
关注并星标 从此不迷路 计算机视觉研究院 转自腾讯优图 近日,AAAI 2023(Association for the Advancement of Artificial Intelligence) ...
- 论文速递:AAAI 2023 | 优图16篇论文速览,含多标签分类、姿态估计、目标检测、HOI、小样本学习等研究方向
近日,AAAI 2023(Association for the Advancement of Artificial Intelligence)国际先进人工智能协会公布了录用结果,本届会议共有8777 ...
- AAAI 2023 | 基于多模态标签聚合的视频检索模型TABLE,多项SOTA
©作者 | QQ浏览器搜索技术中心.腾讯PCG ARC Lab 来源 | 机器之心 近年来,互联网短小视频内容的爆发式增长,对视频 - 文本检索(Video-Text Retrieval)的能力提出了 ...
- 长文 | 腾讯提出 AI For FEW 构想,呼吁人工智能为地球思考
美国当地时间 4 月 3 日,联合国人居署与腾讯在纽约联合国总部共同举办主题研讨会,探讨地球所面临的最基础的挑战,以及如何利用人工智能(AI)等新兴技术提供解决方案,创新高效地实现可持续发展目标.联合 ...
- AAAI 2023 | CF-ViT:由粗到细的两阶段动态推理架构
©作者 | 陈锰钊 单位 | 厦门大学 研究方向 | 模型压缩与加速 此文章介绍刚被 AAAI 2023 会议接收的动态 ViT 论文 CF-ViT: A General Coarse-to-Fine ...
- 又爆作弊丑闻?AAAI 2023审稿人被作者找上门,才发现rebuttal阶段审稿人互相可见!...
点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 点击进入-> CV 微信技术交流群 转载自:新智元 | 编辑:Aeneas 好困 [导读]AAAI 2 ...
- 又爆作弊丑闻?AAAI 2023审稿人被作者找上门,才发现rebuttal阶段审稿人互相可见...
报道 编辑:Aeneas 好困 [导读]AAAI 2023进入rebuttal阶段时,竟然有一位审稿人被论文作者认了出来,找上了门. 前几天,AAAI 2023的第二轮审稿意见已经出炉. 但谁 ...
- AAAI 2023:清华SIGS信息学部19篇论文入选,含多模态、目标检测、语义分割等方向...
2022 点击蓝字 关注我们 关注并星标 从此不迷路 计算机视觉研究院 计算机视觉研究院专栏 作者:Edison_G AAAI是人工智能领域最重要的顶级国际学术会议之一,旨在推动人工智能领域的研究和应 ...
最新文章
- 打包 React 项目并在服务器运行。
- linux grep 显示多行信息
- 促使网站关键词排名稳定的技巧有哪些?
- Java设计模式(二十二):原型设计模式
- Oracle查询忽略大小写的实现方法
- GitLab CI 自动部署netcore web api 到Docker
- 升级总代分享思路_桃生企业至尊七郎瓷砖新展厅全新升级惊艳亮相
- 2019.03.06 22.25
- C语言进程的内存地址空间分配
- 表格是html文档的基本属性吗,Html
- python函数参数的引用传递_Python初学者笔记(八):函数参数的值传递和引用传递...
- 鼠标移开事件(onmouseout)
- 如何监控主从故障是否正常?MySQL数据库
- Set,Map数据结构
- 【.Net Framework 体积大?】不安装.net framework 也能运行!?原理补充-3
- 单元测试/集成测试/系统测试的区别
- Matlab 2016a 安装教程
- 关于keeplive
- 奥维地图从服务器获取信息超时,2021奥维地图不能用了原因及解决办法
- GPS定位开发步骤以及流程图
热门文章
- 【Linux】调试常见的应用程序奔溃“Segmentation fault (core dumped)”
- z6青春版刷Android11,联想Z6青春版MIUI刷机包(系统刷机最新完整固件MIUI11稳定版)...
- 售前工程师的成长-一个老员工的经验之谈
- 解决Typora文件夹中的.md文件到另一台笔记本图片丢失问题
- ASP.Net: EshineASPNet教程-身份证校验与正则
- MySQL——子查询
- 什么方法可以快速将文字转语音
- 洛谷:第n小的质数(c语言)
- opengles实现卡通效果
- 线程池的五种状态及创建线程池的几种方式