编辑 | 深蓝AI

点击下方卡片,关注“自动驾驶之心”公众号

ADAS巨卷干货,即可获取

点击进入→自动驾驶之心【全栈算法】技术交流群

后台回复【相机标定】获取超详细的单目双目相机模型介绍、内外参标定算法原理视频!

本文总结自12月4日赵季博士关于【相对位姿估计的进展和新方法】公开课。

位姿估计是多视图几何的重要方向。赵博士在公开课第一部分首先概述了位姿估计的背景,然后回顾了经典的最小配置问题、多项式方程组的解法,介绍了目前学术界的研究方向,最后给出学习资料和相关软件资源。

第二部分中,赵博士介绍了经典的最小配置问题(5点法&6点法)的新解法。这部分包括赵博士的工作(把rotation和translation解耦,构造只包含rotation的方程组)。

第三部分,赵博士介绍了从新的几何特征“射线-点-射线”中估计位姿。第四部分,赵博士介绍了N点法的全局最优位姿估计。

01

位姿估计背景介绍和经典方法介绍

位姿估计是三维视觉的重要基础,有着非常广泛的应用,例如无人机定位,无人车定位,三维重建等。

按照给定的观测不同,位姿估计可以分为三大类。根据点云求位姿,属于3D-3D位姿估计,称作点云配准问题,代表算法包括ICP,NDT,LOAM等。根据图像点和地图点求位姿,属于3D-2D位姿估计,称作绝对位姿估计,代表算法包括P3P,PnP等。根据具有公共视野的图像求位姿,属于2D-2D位姿估计,称作相对位姿估计,代表算法包括5点法、8点法、单应矩阵法等。本公开课重点关注2D-2D相对位姿估计方法。

赵博士首先介绍了经典的最小配置问题以及其最小配置解,即至少需要多少个点(观测)来求相对位姿。对于单目相机,最少需要5个点,对于多目相机或者广义相机,最少需要6个点。参考论文[C. Longuet-Higgins 1981], [D.Nister 2004], [H. Stewenius et al 05,06].

随后,赵博士介绍了定制化最小配置问题的三个研究方向,分别是:

1.利用先验降低问题的自由度,例如已知旋转角、已知旋转轴、平面运动约束、阿克曼运动模型等

2.将其他变量和位姿同时估计,例如相机焦距、主点、畸变参数等。

3.处理非标准的位姿估计问题,例如使用新型的特征匹配恢复位姿(仿射匹配,射线-点-射线匹配)、处理新型相机或场景等。

最小配置问题的核心是求解多项式方程组。接下来,赵博士介绍了多项式方程组求解的方法以及工具。常见方法包括closed-form solution, companion matrix, Sturm sequence, Gröbner basis (格罗布纳基), resultant method (结式法), Wu’s method (吴文俊方法), homotopy continuation (同伦连续)等。工具包括Macaulay2, Maple,以及方程求解器的自动生成程序。赵博士在公开课中着重介绍了针对多元高阶方程的Gröbner basis方法。Gröbner basis方法当前分为离线和在线两部分,离线构造出消元模板,在线填充消元模板中的非零元素,便于提高计算效率。感兴趣的同学可以看原公开课视频。

第一部分最后,赵博士介绍了最优位姿估计的研究方向,包括设计具有鲁棒性和全局最优性的算法,解的最优性认证,从两视图的位姿估计扩展到多视图,基于机器学习的位姿估计方法等。

02

5点法 & 6点法

赵博士在第二部分中介绍了他和合作者的工作,主要是对经典最小配置问题提出新的解法。在最小配置问题中,对于单目相机,最少需要5个点可以恢复位姿。而对于一般的多目相机,最少需要6个点。

(图1)左:单目相机 右:多目相机

单目相机和多目相机的位姿恢复都可以根据方向向量和平移的共面性建立几何约束。

(1)单目相机

对于单目相机,经典的对极几何刻画了两个方向向量、平移向量t之间的共面关系。具体做法是建立约束,即,令,称为本质矩阵,则。也可以不引入本质矩阵,使用更加直接的方式建模。例如,在[Kneip et al 2012 ECCV]中潜在地使用了一种表示形式:

此时可以去掉t,令矩阵不满秩即可,任取矩阵3行构造的行列式应为0。这样就得到了只与R相关的约束,实现了R和t的解耦。当R求出后,对相应的5*3矩阵做SVD分解求t。

(2)多目相机

对于多目相机,不同相机的光心之间还有一个相对偏置,因此多目相机的对极几何变得复杂,为:

可以看出,单目情况的3维方向向量变成了6维的普吕克直线表示,单目情况的3*3的本质矩阵变成了6*6的广义本质矩阵。单目的五点法[D. Nister 2004]没法推广到多目情况。为了解决这个问题,[Stewenius, Astrom, Nister 2005]提出了一种匹配点深度参数化的解法,成为多年来几乎唯一的解法。

我们的旋转-平移解耦方法可以轻易地推广到多目相机。区别在于单目的5*3矩阵变成了6*4矩阵,再任取其中的4*4矩阵,令它门的行列式为0。此外,如果存在三个匹配在两个视图中都被相同的单相机成像,则需要增加3*3子矩阵的行列式为0的约束。

需要对旋转R给出合适的参数化方法,用于构建多项式方程。R有多种表示方法,赵博士列举了Cayley,Quaternion,Direction cosine matrix(DCM)三种方法。

如何去选择旋转的表示方法呢?好的表示方法要使方程组的阶次尽量低,未知变量尽量少,对称性尽量少。

赵博士工作用Cayley和quaternion表示方法来求解5点法[1]和6点法[3]中旋转矩阵R。Cayley表示旋转的具体5点/6点法求解步骤在视频中有讲解,感兴趣的同学请看原公开课,在此不赘述。

赵博士总结了R和t解耦方法的一般步骤[3]:

1. 用Rt写出约束,R建议用Cayley或quaternion表示。

2. 将约束表示为M*t=0,其中M只和R相关。单相机的t是3维,多相机系统的t是4维齐次坐标。

3. 让M子矩阵的行列式为0,构造多项式方程。

4. 对于多相机,如果存在三个匹配在两个视图中都被相同的单相机成像,则需要增加3*3子矩阵的行列式为0的约束。

5. 对于步骤3和4的多项式方程,除以Cayley或quaternion相关的尺度因子。

6. 使用多项式方程求解的工具链求出R,再求出t

本部分最后,赵博士介绍了其工作的实验结果。5点法对纯旋转比较友好,扩展性强。6点法相比于之前方法具有更高的效率,更好的数值稳定性,扩展性更强,可以方便地推广到各种复杂的定制化问题。

03

从射线-点-射线(RPR)中恢复位姿

(图2)室内RPR几何结构

结构化环境中建图和定位时,注意到室内有很多线段结构。但是,理论上可以证明无法从两视图的线段匹配中恢复位姿。因此,提出了将射线-点-射线组成角进行匹配,这种结构称为RPR (ray-point-ray)。如果知道这种角结构在3D空间中的真实角度,我们就可以建立约束来估计位姿。如图三所示,为角结构的几何约束示意图。

(图3) 二视图中的RPR约束

每个ray的观测引入了一个平面,可以求出平面的法向量。由于3D空间中的ray同时位于两个平面上,它的方向向量正比于两个法向量的叉乘。因此我们可以建立约束。

对于90度角:

对于一般角:

赵博士的实验结果如下。其中消元模板的尺寸是求解效率相关的指标,模板尺寸越小越好。可以看出,Cayley表示的求解效率是最高的。这种RPR约束具有理论价值,也为结构化场景的视觉定位提供了新思路。

(图4)不同R表示方法对RPR约束求解对比

04

N点法的全局最优位姿估计

第四部分中,赵博士介绍了用多点法求全局最优位姿。在实际工作中,冗余观测较多,而且存在噪声。因此,多点法相比于最小配置解法,具有更高的精度。

赵博士首先介绍了一些经典工作和相关论文。

1.代数误差

·LMI optimization [Chesi 2009 PAMI]

·local optimization, BnB [Kneip & Lynen 2013 ICCV]

·SDP + R-T representation [Briales et al 2018 CVPR]

2.几何误差(例如重投影误差)

·Gauss-Newton, Levenberg-Marquardt.

3.DLT method

·8 point method + normalization [Hartley 1997 PAMI]

4.Certifiable solvers for related tasks

·geometric perception [H. Yang & Luca Carlone ICCV’19, RAL’20, CVPR’20, NIPS’20]

·certifiable solvers [Briales et al IROS’16, ICRA’17, CVPR’17, Garcia-Salguero et al IVC’21]

·rotation averaging [Rosen et al IJRR’19, Eriksson et al CVPR’18, Dellaert et al ECCV’20]

然后赵博士介绍了通过几何约束建立约束模型、和最小配置解不同的是,多点法需要考虑噪声,因此从解方程问题变成了优化问题,优化目标是使方程的残差尽可能接近0。

使用代数误差时,优化问题为

其中,归一化本质矩阵的集合定义为:

对目标函数进行整理,变为标准的二次型

由于归一化本质矩阵的充分必要条件为

可以减少约束中的未知数,把问题重新整理为标准QCQP问题:

我们需要对上述优化问题进行求最优值,下图为非凸QCQP问题的求解框架。核心思想是把原来的非凸优化通过半正定松弛转化为凸优化。求解完毕后再将最优解返回到原问题。

最后,赵博士介绍了一些相关的主题:

1. 松弛紧性(tightness)的判断、松弛的局部稳定性证明;

2. 把N点法嵌入到鲁棒框架,得到鲁棒N点法;

3. 实验结果,包括效率评估、鲁棒N点法的精度和鲁棒性、匹配点的个数与位姿精度的关系等。

05

推荐的学习资源

Tutorial & Survey

1).The art of solving minimal problems

-http://cmp.felk.cvut.cz/minimal-iccv-2015/

-http://cmp.felk.cvut.cz/minimal-cvpr-2019/

2).Minimal Problems in Computer Vision

-http://aag.ciirc.cvut.cz/minimal/

6).Global Optimization for Geometric Understanding with Provable Guarantees

-https://mit-spark.github.io/GlobalOptimization-ICCV2019/

CAS Software

1).Macaulay2:

- http://www2.macaulay2.com/Macaulay2/

2).Maple software

Automatic solver generator程序

1).Automatic generator for minimal solvers.

- http://people.inf.ethz.ch/vlarsson/

2).Automatic generator.

- https://github.com/PavelTrutman/Automatic-Generator

3).Polyjam.

- https://github.com/laurentkneip/polyjam

4).Gaps.

- https://github.com/prclibo/gaps

教材

1).D.Cox et al. Ideals, Varieties, and Algorithms. Springer, 2013.

2).D.Cox et al. Using Algebraic Geometry. Springer, 2006.

中文资料

1).王东明, 等. 计算机代数(第二版), 清华大学出版社, 2007.

2).李超, 等. 计算机代数系统的数学原理. 清华大学出版社, 2010.

3).北航牟老师. 计算机代数课程视频:

https://www.bilibili.com/video/BV1p7411c7mz?p=1

06

参考文献

[1] Ji Zhao, Laurent Kneip, Yijia He, and Jiayi Ma. Minimal Case Relative Pose Computation using Ray-Point-Ray Features.

IEEE Transactions on Pattern Analysis and Machine Intelligence, 42(5): 1176 - 1190, 2020.

[2] Ji Zhao. An Efficient Solution to Non-Minimal Case Essential Matrix Estimation. IEEE Transactions on Pattern Analysis and Machine Intelligence. DOI: 10.1109/TPAMI.2020.3030161.

[3] Ji Zhao, and Banglei Guan. On Relative Pose Recovery for Multi-Camera Systems. ArXiv:2102.11996.

Webpage:

https://sites.google.com/site/drjizhao/

Github:

https://github.com/jizhaox

自动驾驶之心】全栈技术交流群

自动驾驶之心是首个自动驾驶开发者社区,聚焦目标检测、语义分割、全景分割、实例分割、关键点检测、车道线、目标跟踪、3D目标检测、BEV感知、多传感器融合、SLAM、光流估计、深度估计、轨迹预测、高精地图、规划控制、模型部署落地、自动驾驶仿真测试、硬件配置、AI求职交流等方向;

加入我们:自动驾驶之心技术交流群汇总!

自动驾驶之心【知识星球】

想要了解更多自动驾驶感知(分类、检测、分割、关键点、车道线、3D目标检测、多传感器融合、目标跟踪、光流估计、轨迹预测)、自动驾驶定位建图(SLAM、高精地图)、自动驾驶规划控制、领域技术方案、AI模型部署落地实战、行业动态、岗位发布,欢迎扫描下方二维码,加入自动驾驶之心知识星球(三天内无条件退款),日常分享论文+代码,这里汇聚行业和学术界大佬,前沿技术方向尽在掌握中,期待交流!

多视图几何 | 相对位姿估计的经典回顾和最新进展!相关推荐

  1. 传统的6d位姿估计fangfa1_李飞飞团队最新论文:基于anchor关键点的类别级物体6D位姿跟踪...

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 简介 作者提出了一种基于RGB-D的深度学习方法6PACK,能够实时的跟踪已知类别物体.通过学习用少量 ...

  2. 图灵测试70载,回顾对话机器人的经典实践和最新进展

    本文内容整理自 PaperWeekly 和 biendata 在 B 站组织的直播回顾,点击文末阅读原文即可跳转至 B 站收看本次分享完整视频录像,如需嘉宾课件,请在 PaperWeekly 公众号回 ...

  3. 文本嵌入的经典模型与最新进展

    来自 | AI研习社   作者 | WBLUE 词嵌入和句子嵌入已成为所有基于深度学习的自然语言处理(NLP)系统的重要组成部分.它们在定长的密集向量中编码单词和句子,以大幅度提高文本数据的处理性能. ...

  4. 文本嵌入的经典模型与最新进展(下载PDF)

    来自 | AI研习社   作者 | WBLUE 词嵌入和句子嵌入已成为所有基于深度学习的自然语言处理(NLP)系统的重要组成部分.它们在定长的密集向量中编码单词和句子,以大幅度提高文本数据的处理性能. ...

  5. CVPR 2021 | 国防科大:基于几何稳定性分析的物体位姿估计方法

    作者|机器之心编辑部 来源|机器之心 物体 6D 姿态估计是机器人抓取.虚拟现实等任务中的核心研究问题.近些年来,随着深度学习技术和图像卷积神经网络的快速发展,在提取物体的几何特征方面出现了许多需要改 ...

  6. 重磅!国内首个三维重建系列视频课程,涉及SFM、立体匹配、多视图几何、结构光、单目深度估计等(最新版)...

    写在前面 感谢大家的一路陪伴与支持,这里赠送一张「3D视觉从入门到精通」知识星球优惠券,有效期两天,有需要的可以使用. 三维重建技术是计算机视觉的重要技术之一,基于视觉的三维重建技术通过深度数据获取. ...

  7. 终于来了,国内首个三维重建系列视频课程,涉及SFM、多视图几何、结构光、单目深度估计等...

    三维重建技术是计算机视觉的重要技术之一,基于视觉的三维重建技术通过深度数据获取.预处理.点云配准与融合.生成物体表面等过程,把真实场景刻画成符合计算机逻辑表达的数学模型. 由于三维重建对图像.光学.成 ...

  8. 国内首个三维重建系列视频课程,涉及SFM、立体匹配、多视图几何、结构光、单目深度估计等...

    原文链接:国内首个三维重建系列视频课程,涉及SFM.立体匹配.多视图几何.结构光.单目深度估计等... 三维重建技术是计算机视觉的重要技术之一,基于视觉的三维重建技术通过深度数据获取.预处理.点云配准 ...

  9. 计算机视觉中的多视图几何<Part0—基础知识:射影几何、变换和估计>(1)

    1. 2D射影几何和变换 射影几何的概念和表示法是多视图几何分析的核心,使用齐次坐标就能用线性矩阵方程来表示非线性映射(例如透视投影):主要目的是为了从透视图像中恢复仿射和度量性质. 1.1 平面几何 ...

最新文章

  1. OpenCV常遇问题解决方法汇总
  2. 时间有限我长话短说:3060显卡免费送啦!
  3. MobaXterm无法退格删除,出现^H
  4. c语言创建学生成绩表,C语言创建信息链表,求助
  5. 组合模式的安全模式与透明模式
  6. Java定时任务以及ScheduledThreadPoolExecutor需要注意的问题
  7. 扎克伯格被美国一刊物评为“年度恶人” Facebook为世界最差网站
  8. HTML5拖拽API的使用实例
  9. 人民邮电出版社与作者陈黎夫共同举办在线编辑、作者交流活动
  10. 单片机汉字点阵c语言程序,51单片机C语言多种点阵屏驱动程序(开发软件为keil C...
  11. Python 修改图片的时候抗锯齿
  12. 水经注地图发布服务中件间功能简介
  13. snapchat注册不到_如何将链接添加到您的Snapchat快照
  14. 解决 您的安全设置不允许将此应用程序安装到您的计算机上的问题
  15. C语言一般考点笔试,c语言常见笔试题及答案
  16. python在大数据分析中的应用
  17. idea 运行项目显示 Command line is too long. Shorten command line for
  18. paramiko使用
  19. CAN光端机在西门子FC18/720消防主机海上风电厂之星型联网方式
  20. 硬货-如何用风控拯救下架的小红书

热门文章

  1. 感恩节祝福html,感恩节英文贺卡祝福语(双语)
  2. 微软首席开发大师 查尔斯-西蒙尼
  3. EN 14319-1 建筑设备与工业装置用隔热产品.原位形成分散硬质聚氨酯(PUR)和聚异氰脲酯(PIR)泡沫产品.第1部分:硬质泡沫塑料分散系统安装前规范--CE认证
  4. 瑞昱Realtek显示类芯片-简介V2.0
  5. 复杂网络研究机构与大牛
  6. 【HTML 往日冒险 09】多媒体 插件 音频audio 视频video iframe YouTube iframe bilibili
  7. 如何快速处理退信问题?
  8. 带你了解Docker背后的守护进程
  9. 好莱坞正在用算法决定拍什么电影,这能让烂片少一些吗?
  10. 前端点击图片的某个区域进行映射