凸面镜反射场景无监督域适应语义分割的一些问题

大家好,我是来自北京大学的石永杰同学,最近我们组的工作《Unsupervised Domain Adaptation for Semantic Segmentation of Urban Street Scenes Reflected by Convex Mirrors》

被IEEE Transactions on Intelligent Transportation Systems (T-ITS)接收,传送门https://ieeexplore.ieee.org/document/9903282

在做这个工作的时候,遇到了一些问题,第一个问题是为什么需要UDA来解决这个问题?第二个问题是(包括审稿人也在问):“凸面镜作为光学成像里的一个基本器件,在光学设计领域已经被充分地研究,并且有精确地物理建模,为什么要将凸面镜成像的畸变分解为径向畸变和透视畸变?”

这里要从无监督域适应(UDA)和针相机模型以及凸面镜的成像规律说起。

关键词

凸面镜 语义分割 径向畸变 畸变 无监督域适应 北京大学

无监督域适应

域适应(Domain Adaptation)技术主要是解决分类器在测试的时候有偏差的问题,如下图所示

域适应技术分为三种setting,分别是全监督域适应,半监督域适应以及无监督域适应。全监督域适应要求目标域所有的样本都具有标签,半监督则要求目标域数据有部分标签。对于不同的任务往往需要不同的设定,对图像分类任务而言,每张图像给打一个标签,标注的任务相对而言不是那么地繁重。但是对于语义分割任务则不同,Cityscapes数据集报告说每张Cityscapes里面的图像需要1.5小时的标注时间,成本可谓非常之高,因此对于无监督域适应而言,如果有大量的现成的图像(源域图像),和大量的目标域无标记的图像,就能够提升模型在目标域的性能,这将会极大减少分割任务标注的压力。

对于凸面镜这种新场景而言,如果用监督学习的方式进行训练,则需要大量的标记数据,这显然不太现实。在数据采集的过程中,我们在北京大学校园内采集,使用的是三脚架以及买的一些凸面镜,北大的师弟帮忙拍摄采集;在标注的过程也是,北京大学的师弟帮忙标注,算了一下,每个人标注一张数据,复杂的可能要花三个小时,简单的至少也要一个小时,工作量可见之大。

这也是为啥我们决定用无监督域适应这种方法来提升凸面镜反射场景的分割精度。

针孔相机模型

针孔相机模型是计算机视觉的基础,针孔相机模型的理论基础是小孔成像,如下图所示

如果已知焦距和物距,实际上可以算出成像平面上的物体大小。

现有的很多公开数据集都已经是标定之后的图像或者是径向畸变程度很小的图像,读者拿到的图像都符合或者是几乎接近针孔相机模型所成的图像的,如果想用针孔相机模型下拍摄到的图像用来模拟镜面反射的图像,需要镜面反射的过程能够保持单光心的性质,即空间中一点发射的光线经过镜面反射之后,其反向延长线同样地相交于一点。这对于平面镜是显然的,对于凸面镜却不是这样(这里仅以常见的球面镜为例)。

凸面镜成像

对平面镜而言,空间中的一点PPP发出的光线经过反射,其反向延长线相交于一点P′P^\primeP′,这里给出简单的证明。根据反射定理,可以得到∠PA2M=∠MA2P′\angle PA_2M=\angle MA_2P^\prime∠PA2​M=∠MA2​P′,而A2MA_2MA2​M又垂直于PP′PP^\primePP′,则△PA2M\triangle PA_2M△PA2​M与△P′A2M\triangle P^\prime A_2M△P′A2​M全等,因此有PM=PM′PM=PM^\primePM=PM′,同样可以证明在三角形△PA1M\triangle PA_1M△PA1​M与△P′A1M\triangle P^\prime A_1M△P′A1​M全等。所以他们相交于P′P^\primeP′这一点。

但是对于凸面镜却不是这样。假设凸面镜表面的形状为球面,空间中的一点PPP距离凸面镜球心OOO的距离为OPOPOP,球面凸面镜的半径为RRR,如上图所示。从PPP点发出的入射光线沿着α\alphaα角入射到球面凸面镜上,入射点为AAA,反向延长反射光线,与光轴相交于P′P^\primeP′。如果凸面镜能够保持入射光束的单光心性,则同一位置不同光线(α\alphaα角不同)经过凸面镜反射后,其反向延长线理应汇聚于P′P^\primeP′点,否则,凸面镜不能够保持入射光束的单光心性。假设入射角与出射角为θ\thetaθ,由于入射角与出射角相同,并且出射角与∠P′AO\angle P^\prime AO∠P′AO互为对顶角,因此∠P′AO=θ\angle P^\prime AO=\theta∠P′AO=θ。
根据正弦定理,对△POA\triangle POA△POA有:
sin⁡(π−θ)OP=sin⁡αR.(1)\frac{\sin(\pi-\theta) }{OP} = \frac{\sin \alpha}{R}.\tag{1} OPsin(π−θ)​=Rsinα​.(1)
同时入射角θ\thetaθ为△PAO\triangle PAO△PAO中∠PAO\angle PAO∠PAO的外角,因此有∠APO+∠AOP=θ\angle APO+\angle AOP=\theta∠APO+∠AOP=θ,∠POA=θ−α\angle POA=\theta-\alpha∠POA=θ−α,则可求出∠AP′O=π−2θ+α\angle AP^\prime O=\pi-2\theta+\alpha∠AP′O=π−2θ+α。对△P′OA\triangle P^\prime OA△P′OA有:
sin⁡θOP′=sin⁡(π−2θ+α)R.(2)\frac{\sin \theta }{OP^\prime} = \frac{\sin \left(\pi-2\theta+\alpha\right)}{R}. \tag{2} OP′sinθ​=Rsin(π−2θ+α)​.(2)
结合上面两个式子,可以得到
OP′=sin⁡αsin⁡(2θ−α)OP.(3)OP^\prime = \frac{\sin \alpha}{\sin\left( 2\theta-\alpha\right)}OP.\tag{3} OP′=sin(2θ−α)sinα​OP.(3)
在上式中,OPOPOP为常数。根据式1,θ\thetaθ可用α\alphaα表示,并且sin⁡αsin⁡(2θ−α)\frac{\sin \alpha}{\sin\left( 2\theta-\alpha\right)}sin(2θ−α)sinα​不可化为常数,因此OP′OP^\primeOP′与入射角α\alphaα密切相关,即凸面镜反射并不能保持入射光束的单光心性质。由相机模型是假设空间中的入射光线经过小孔投射到成像平面,而凸面镜并不能保持入射光束的单光心性,因此无法利用现有的正常图像来严格模拟凸面镜反射图像,这也是为什么无法用现有的Cityscapes等语义分割数据集来严格模拟凸面镜成像的原因。

总结

图像,这也是为什么无法用现有的Cityscapes等语义分割数据集来严格模拟凸面镜成像的原因。

总结

面向新场景时,因为标注工作量大,所以需要UDA。而利用现有的针孔相机模型拍摄的图像无法严格模拟凸面镜反射图像,因此我们从直观上将凸面镜产生的形变分解为径向畸变还有透视畸变,以此来模拟凸面镜产生的变形,提升分割模型在目标域的表现性能。

凸面镜反射场景无监督域适应语义分割的一些问题相关推荐

  1. *基于类平衡自我训练的无监督域自适应用于语义分割

    基于类平衡自我训练的无监督域自适应用于语义分割 摘要:最近的深度网络实现了最先进的性能在各种语义分割任务中.尽管有这样的进步,但是这些模型在现实世界中面临挑战,它们存在很大的差别在已标签训练/源文件和 ...

  2. 2022TGRS/云检测:用于遥感图像云检测的无监督域不变特征学习Unsupervised Domain-Invariant Feature Learning for Cloud Detection

    2022TGRS/云检测:Unsupervised Domain-Invariant Feature Learning for Cloud Detection of Remote Sensing Im ...

  3. 干货!MetaCorrection:解决无监督域适应的domain gap问题

    点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 无监督域适应(UDA)旨在把知识从有标签源域数据迁移到无标签目标域数据上.现有的基于自训练(self-training)的UDA方法为目 ...

  4. 如何将最大化互信息引入到无监督域适应(UDA)任务?

    ©作者 | 李加贝 单位 | 浙江工商大学 研究方向 | 视频文本检索 本文介绍三篇来自于北京大学和牛津大学的工作,其思想都主要是利用了最大化互信息这一概念来减小域特征差异的,通过交叉熵损失函数来隐式 ...

  5. CVPR2019:Domain-Specific Batch Normalization for Unsupervised Domain Adaptation无监督域适配的特定域批处理规范化

    CVPR2019:Domain-Specific Batch Normalization for Unsupervised Domain Adaptation无监督域适配的特定域批处理规范化 0.摘要 ...

  6. 最新综述:视频数据的无监督域适应

    ©作者 | 许悦聪 单位 | 新加坡科技研究局 研究方向 | 视频迁移学习.领域自适应 深度学习随着大数据的不断产生在日常生活生产中发挥着愈来愈重要的作用.针对视频分析的深度学习方法更是随着各类大型数 ...

  7. 无监督域适应、人体解析、视频异常检测和水果成熟度分类,推荐本周那些有意思的​CV综述...

    关注公众号,发现CV技术之美 今天向大家推荐四篇近期发布的文献综述,包含无监督域适应.人体解析.视频异常检测和水果成熟度分类. ▌Source-Free Unsupervised Domain Ada ...

  8. 无监督域对抗算法:ICCV2019论文解析

    无监督域对抗算法:ICCV2019论文解析 Drop to Adapt: Learning Discriminative Features for Unsupervised Domain Adapta ...

  9. 【论文笔记】SIFA——基于GAN的双向跨模态无监督域适应框架

    本文是论文<Unsupervised Bidirectional Cross-Modality Adaptation via Deeply Synergistic Image and Featu ...

最新文章

  1. lxml安装_Beautiful Soup的安装和使用
  2. dnf强化卷代码_DNF:夏日套时装礼盒开服竟卖八千万金币,500万捡漏到黄金书
  3. 将 Mac 直接连接到 Windows 电脑
  4. (8)操作系统安全机制之二
  5. WINDOWS 2008 AD权限管理服务(ADRMS)完全攻略
  6. 祝贺Terrylee博客园Post达到100篇
  7. java 正则表达式 中文数字和字母_Java中过滤出字母、数字和中文的正则表达式...
  8. 23. WebVR播放器: 消费升级带来的机遇
  9. 1.5.2 Prime Palindromes 回文质数(构造回文)
  10. 计算机网络系统集成实验指导,系统集成实验指导.docx
  11. 切图具体需要切什么内容_什么是切图?网页制作中的切图是什么?
  12. MySQL如何执行关联查询
  13. C#实现多人视频聊天
  14. TTP223-BAT功能简介
  15. win10右键文件夹无反应
  16. 求二叉树第K层节点个数(递归)
  17. 支付宝扫码支付模式平台介绍
  18. AIGC能否助力三六零实现“戴维斯双击”?
  19. 无向图的Depth-first search和Breadth-first Search
  20. 解决:Caused by: com.mysql.cj.exceptions.InvalidConnectionAttributeException: The server time zone valu

热门文章

  1. C++实训 面向对象 - 运算符重载与友元函数
  2. 女子车祸后开始“改造”自己:左手芯片开门、右手可刷 NFC,这些“生物黑客”有多疯狂?
  3. 索尼PXW-Z280摄像机断电损坏RSV(MXF)视频40G文件修复成功案例
  4. 【转载】如何让电脑开机定时启动某个应用程序
  5. Color Coherence Vector
  6. Unity相机自动追踪物体并保持一定距离
  7. BlackIce病毒分析
  8. 滴滴云服务器的注册与快速配置教程
  9. 适用于南方电网61850icd模型文件的模型定义导出工具
  10. Spring Boot 如何使用 JUL 进行日志记录