1. 研究问题

SGM算法中惩罚系数控制这视差图的平滑度和不连续性,以往的方法基于经验进行设置,无法根据不同的结构信息进行调整。

2. 研究方法

SGM-Nets提出使用CNN进行惩罚估计,将一个小图像块及其位置输入到SGM-Nets中以预测该位置的惩罚,为了训练网络,引入了一种新颖的损失函数,而且还提出一种新的SGM参数化,它根据正或负视差变化而赋予不同的惩罚,以便更有区别的表示对象结构。

2.1 Semi-global matching

2.2 SGM-Net

2.2.1 Standard parameterization

2.2.1.1 Path cost

沿路径遍历视差的模糊性其实说明了Path loss有时候会违反上图中第一行的条件,从而导致视差图的模糊,如Fig 5(c)的A所示。

2.2.1.2 Neighbor cost


使用Neighbor cost,会改善视差图的模糊,如Fig 5(d)的A所示。但是如果仅使用Neighbor cost,就会导致很多的视差错误,如Fig 5(d)的B所示。
因此将Path cost 和 Neighbor cost 结合,得到下面的总损失函数。

注:使用Neighbor cost的必要条件是在pixel x1x_1x1​处的视差必须被正确估计,也就是说,必须满足在dgtx1d_{gt}^{x_1}dgtx1​​处的聚合代价最小,否则x0x_0x0​处的视差很可能会不正确。因此,Neighbor cost并不能应用到所有的像素点。

2.2.2 Signed parameterization


2.3 SGM-Net architecture

3. 实验结果

训练:

  1. 测试了SGD和Adam两种优化器,经过实验证明后者能达到更低的错误率。
  2. SGM-Net在一块Titan X GPU 上训练,需要几天的时间,但比MC-CNN的训练要快。
  3. 在SceneFlow的Driving,KITTI-12,KITTI-15上训练并测试精度。
  4. 对于Driving,选取焦距为35mm和低运动的图像对,这样,它的布局和模糊就和KITTI很相似。由于图像底部的马路的视差很大,会导致GPU内存占用超标,所以裁剪掉顶部和底部的100像素。每5帧图像对提取一对,以移除相似的场景。

4. 结论

(1)SGM-Net可以通过CNN预测最优的惩罚参数,以适应与不同的结构和视差变化方向,提高视差图精度。
(2)SGM-Net 在 KITTI 基准数据集上的准确性优于最先进的精度。

5. 局限性

依然适用SGM框架进行代价过滤,耗时过长,无法应用于实时深度估计中。

《SGM-Nets: Semi-global matching with neural networks》相关推荐

  1. 【步态识别】多视角3D卷积网络的步态识别 算法学习《MULTI-VIEW GAIT RECOGNITION USING 3D CONVOLUTIONAL NEURAL NETWORKS》

    目录 1. 论文&代码源 2. 论文亮点 3. 模型结构 3.1 技术路线 3.2 数据预处理 3.3 训练和测试 4.实验结果 4.1 CMU 4.2 USF 4.3 CAISA-B 5.总 ...

  2. 《Ensemble Learning Methods for Deep Learning Neural Networks》笔记

    文章连接:Ensemble Learning Methods for Deep Learning Neural Networks 前言 神经网络提供了更大的灵活性,并可根据可用的培训数据量进行调整.但 ...

  3. 《Channel Pruning for Accelerating Very Deep Neural Networks》论文笔记

    1. 概述 这篇文章提出了一种基于LASSO回归的通道选择和最小二乘重构的迭代两步算法,有效地对每一层进行修剪.并进一步将其推广到多层和多分枝的场景下.论文中的方法能够减少累积误差并且提升对于不同结构 ...

  4. Paper:《Generating Sequences With Recurrent Neural Networks》的翻译和解读

    Paper:<Generating Sequences With Recurrent Neural Networks>的翻译和解读 目录 Generating Sequences With ...

  5. CV:翻译并解读2019《A Survey of the Recent Architectures of Deep Convolutional Neural Networks》第一章~第三章

    CV:翻译并解读2019<A Survey of the Recent Architectures of Deep Convolutional Neural Networks>第一章~第三 ...

  6. Paper:Xavier参数初始化之《Understanding the difficulty of training deep feedforward neural networks》的翻译与解读

    Paper:Xavier参数初始化之<Understanding the difficulty of training deep feedforward neural networks>的 ...

  7. Paper之DL之BP:《Understanding the difficulty of training deep feedforward neural networks》

    Paper之DL之BP:<Understanding the difficulty of training deep feedforward neural networks> 目录 原文解 ...

  8. 论文笔记(一)《Intriguing properties of neural networks》

    对抗样本(一)<Intriguing properties of neural networks> 神经网络的有趣特性 两点: 性质1:单个的深层神经元与随机线性组合的多个深层神经元并没有 ...

  9. 《Intriguing properties of neural networks》代码实现——Pytorch

    <Intriguing properties of neural networks>代码实现--Pytorch 一.代码实现 #导入库 import torch import torch. ...

最新文章

  1. 【JavaScript】JavaScript基础-变量、运算符与控制语句
  2. 深入讲解MPLS/×××技术原理
  3. javascript漏洞-检测到目标站点存在javascript框架库漏洞
  4. 有趣的MS Live Labs
  5. python扫雷的代码及原理_基于Python实现的扫雷游戏实例代码
  6. 一文了解OOM及解决方案,你还看不明白?
  7. 【牛客 - 551E】CSL 的魔法(贪心,思维,STLmap,分块)
  8. Kubernetes 诞生七年,凭什么成为主流?
  9. SpringBoot中@Email报错解决
  10. 阿里面试官:分别说说微信和淘宝扫码登录背后的实现原理?
  11. usb声卡驱动_最适合专业音乐人网络直播的声卡型号
  12. redis-trib.rb 搭建集群
  13. intel ax200ngw刷killer 1650x教程
  14. 小白也能懂的hadoop生态圈,很黄很暴力!
  15. Word排版——毕业论文专业排版5——目录
  16. 哪个程序猿还没段风花雪月的错过
  17. 哈工程计算机考研复试各科总分,考研复试总分是多少
  18. c++ 箭头符号怎么打_c++笔记--重载箭头运算符
  19. linux svn e170001 认证失败,jenkins - svn: E170001报错的原因以及解决方案
  20. 基于51单片机篮球计分器proteus仿真设计

热门文章

  1. GPIO 错误 提示
  2. ubuntu中的坑——ubuntu18.04版本下安装NVIDIA显卡驱动
  3. Android学习小记-----拦截电话/拒接电话,规避拒接电话前响一声或者两声的问题...
  4. Unity 工具类 之 简单快速 获取当前所在位置,所在城市,经纬度等
  5. 利用canvas画布画哆啦A梦
  6. 鸿蒙和苹果拍照对比,iPhoneSE/11/XR拍照对比:差距依然比想象的大多了
  7. 如何搜索微信号或者手机号去添加企业微信?
  8. 【数据集】驾驶员分心检测数据集(State Farm Distracted Driver Detection)
  9. 保留两位小数正则表达式
  10. 现在普通家用计算机的运算速度,中国目前运算速度最快的计算机