论文

GA-Net: Guided Aggregation Net for End-to-end Stereo Matching

摘要

自从大家开始将SGM的思想引入双目立体匹配网络后,越多越多的学者开始开脑洞。在GANet这篇论文中,作者的主要的贡献就是将SGM的“代价聚合”模块引入到端到端网络之中。

模型

在文章中,作者给出了一个网络结构的示意图。然而由于作者并没有添加任何图例,本人完全看不懂这个图中的具体细节。
为了大致搞清楚本文的网络结构,本文阅读代码,大致画了以下两个图(其中绿色模块是各种卷积,黑色箭头是数据流),表示网络的结构(参考的代码是https://github.com/feihuzhang/GANet/blob/master/models/GANet11.py)

1 特征提取模块

整个模型的第一部分是特征提取模块,包括costguidance模块。cost比较容易理解,和GCNet和PSMNet中并没有什么太大区别,唯一区别在于用了两个堆砌的UNet。guidance模块,有点像导向滤波的参数,在计算这个东西的时候,还专门的融合了高层特征。

2 代价聚合模块

整个模型的第二部分是代价聚合模块,这块是本篇文章的重点。作者也花费了大量的时间和精力来介绍。总的来说其结构图如下,大概就是先用SGA模型做全图传播,然后再用LGA模型做局部传播。

SGA模型的数学模型如下,及大致按照SGM的思路进行代价聚合。这里很多人可能看的云里雾里的,但是其实只要了解SGM,就不是很难。大致意思就是,每个像素在某个视差的代价,不仅应该由自己的观测决定,还需要由一些邻近的观测决定(这里的邻近观测,包括相邻视差和相邻像素,而相邻像素的定义显然和方向有关,所以需要分别从四个方向聚合);总的来说就是data+smooth。

LGA模块的数学模型如下,这个其实也就是一个导向滤波,考虑了一下视差平滑性。

结果

总的而言,本篇文章的模型还是很复杂的,个人感觉效率并不一定能够提高,但是idea是还是很棒的。另外,就是作者的论文和代码差别实在是有点大,看了半天头晕目眩的。。。

三维视觉论文阅读:GANet2019双目立体匹配相关推荐

  1. 三维视觉论文阅读:StereoDRNet2019双目立体匹配

    论文 StereoDRNet: Dilated Residual Stereo Net 摘要 个人感觉StereoDRNet是StereoNet的后续,做了很多的改进,实验效果也非常好. 网络模型 S ...

  2. 三维视觉论文阅读:RAFT2020双目光流

    论文 RAFT: Recurrent All-Pairs Field Transforms for Optical Flow 摘要 2020年下半年以来,深度学习都逐渐走向了迭代优化(例如NeRf), ...

  3. 三维装箱论文阅读小结

    一.<基于混合遗传算法的多箱型集装箱装载问题研究>张长勇 本文以实际问题--航空器货物装载为切入点,研究了遗传算法在航空装载问题中的有效性. 1.问题定义: 多箱型集装箱装载问题: 在一定 ...

  4. 双目结构光系统论文阅读总结

    双目结构光系统总结 1.一般的立体匹配的方法是基于左右两幅图像各像素的灰度相似性进行同名点判断的,哈尔滨工业大学的赵焕谦2017年的硕士毕业论文<基于结构光和双目视觉的三维重建系统研究>中 ...

  5. 编码结构光三维视觉测量系统(二)

    一.摘要 结构光三维视觉测量方法不需要直接接触被测物体,不会磨损被测物体表面,且具有速度快.精度高.实用性高等特点,是进行三维测量的最佳方法之一.而单目结构光视觉测量系统与双目相比,具有成本低.算法简 ...

  6. 双目立体匹配 等 算法 论文 综述 全局局部算法 CSCA NLCA SegmentTree树 DoubleBP Belief-Propagation AD-Census SGM

    双目立体匹配 等 算法 论文 综述 本文GITHUB 博文末尾支持二维码赞赏哦 _ 双目立体视觉技术实质就是模拟人的双眼视觉处理系统来处理通过摄像机采集所 获取的图像,它利用两台或多台摄像机在一定约束 ...

  7. 第一届中国三维视觉大会China3DV论文展示

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 " 6月11日至13日,第一届中国三维视觉大会(China3DV 2021)在厦门召开.大会 ...

  8. CVPR 2021|三维视觉相关论文汇总

    作者丨Tom Hardy@知乎 来源丨https://zhuanlan.zhihu.com/p/355149511 编辑丨3D视觉工坊 1.GDR-Net: Geometry-Guided Direc ...

  9. CVPR 2022 3月3日论文速递(19 篇打包下载)涵盖网络架构设计、姿态估计、三维视觉、动作检测、语义分割等方向

    以下CVPR2022论文打包合集:下载地址 神经网络架构设计 [1] An Image Patch is a Wave: Quantum Inspired Vision MLP(图像补丁是波浪:量子启 ...

最新文章

  1. 【lombok】使用lombok注解,在代码编写过程中可以调用到get/set方法,但是在编译的时候无法通过,提示找不到get/set方法...
  2. 兰州办着眼大数据切实提升数据分析管理能力
  3. indent 的格式
  4. python多线程爬取_python 多线程方法爬取微信公众号文章
  5. C++ 接口(抽象类)
  6. 杂项-Java:JSP
  7. CSS各种选择符的优先级
  8. 直角三角形知道两边求角度_每日一讲:解直角三角形(3.21)
  9. SpriteBuilder中的粒子系统属性
  10. 阿里云镜像下载ubuntu
  11. 数据存储和界面展示(一)
  12. plsql developer 查看存储过程执行计划_产品简介 | X-Developer一站式研发效能管理平台...
  13. 函数声明和函数表达式
  14. 登录 Unix 操作系统
  15. 菲波那切数列java_斐波那契数列—java实现
  16. Linux下常用的优秀软件
  17. tp-link无线路由与android手机无线连接设置指南,手机设置tplink无线路由器_tplink路由器手机设置步骤-192路由网...
  18. html网页字体颜色代码大全
  19. 说实话,Jenkins 真得牛逼!只是你不会用而已~
  20. 如何获取CSDN积分(下载分)

热门文章

  1. Windows 命令行终端可以使用滑轮上下滚动
  2. 【华为OD机试】1041 - 名字的漂亮度
  3. 什么是RAW格式图像?
  4. “十步一杀” 消压力于无形
  5. VsCode使用Ctrl+S保存代码自动格式化Html/Css/JS
  6. 【没用的小知识又增加了--电机】
  7. [益智]: 每个飞机只有一个油箱, 飞机之间可以相互加油(注意是相互,没有加油机)一箱油可供一架飞机绕地球飞半圈
  8. 2021年育婴员(五级)报名考试及育婴员(五级)免费试题
  9. 如何使用google提高搜索效率
  10. HTML5期末大作业:大学生购物商城网站设计——优分期大学生购物商城(7页) 大学生大学生购物商城作业模板下载 静态HTML购物商城网页制作下载_网页设计代码