《SGM-Nets: Semi-global matching with neural networks》
1. 研究问题
SGM算法中惩罚系数控制这视差图的平滑度和不连续性,以往的方法基于经验进行设置,无法根据不同的结构信息进行调整。
2. 研究方法
SGM-Nets提出使用CNN进行惩罚估计,将一个小图像块及其位置输入到SGM-Nets中以预测该位置的惩罚,为了训练网络,引入了一种新颖的损失函数,而且还提出一种新的SGM参数化,它根据正或负视差变化而赋予不同的惩罚,以便更有区别的表示对象结构。
2.1 Semi-global matching
2.2 SGM-Net
2.2.1 Standard parameterization
2.2.1.1 Path cost
沿路径遍历视差的模糊性其实说明了Path loss有时候会违反上图中第一行的条件,从而导致视差图的模糊,如Fig 5(c)的A所示。
2.2.1.2 Neighbor cost
使用Neighbor cost,会改善视差图的模糊,如Fig 5(d)的A所示。但是如果仅使用Neighbor cost,就会导致很多的视差错误,如Fig 5(d)的B所示。
因此将Path cost 和 Neighbor cost 结合,得到下面的总损失函数。
注:使用Neighbor cost的必要条件是在pixel x1x_1x1处的视差必须被正确估计,也就是说,必须满足在dgtx1d_{gt}^{x_1}dgtx1处的聚合代价最小,否则x0x_0x0处的视差很可能会不正确。因此,Neighbor cost并不能应用到所有的像素点。
2.2.2 Signed parameterization
2.3 SGM-Net architecture
3. 实验结果
训练:
- 测试了SGD和Adam两种优化器,经过实验证明后者能达到更低的错误率。
- SGM-Net在一块Titan X GPU 上训练,需要几天的时间,但比MC-CNN的训练要快。
- 在SceneFlow的Driving,KITTI-12,KITTI-15上训练并测试精度。
- 对于Driving,选取焦距为35mm和低运动的图像对,这样,它的布局和模糊就和KITTI很相似。由于图像底部的马路的视差很大,会导致GPU内存占用超标,所以裁剪掉顶部和底部的100像素。每5帧图像对提取一对,以移除相似的场景。
4. 结论
(1)SGM-Net可以通过CNN预测最优的惩罚参数,以适应与不同的结构和视差变化方向,提高视差图精度。
(2)SGM-Net 在 KITTI 基准数据集上的准确性优于最先进的精度。
5. 局限性
依然适用SGM框架进行代价过滤,耗时过长,无法应用于实时深度估计中。
《SGM-Nets: Semi-global matching with neural networks》相关推荐
- 【步态识别】多视角3D卷积网络的步态识别 算法学习《MULTI-VIEW GAIT RECOGNITION USING 3D CONVOLUTIONAL NEURAL NETWORKS》
目录 1. 论文&代码源 2. 论文亮点 3. 模型结构 3.1 技术路线 3.2 数据预处理 3.3 训练和测试 4.实验结果 4.1 CMU 4.2 USF 4.3 CAISA-B 5.总 ...
- 《Ensemble Learning Methods for Deep Learning Neural Networks》笔记
文章连接:Ensemble Learning Methods for Deep Learning Neural Networks 前言 神经网络提供了更大的灵活性,并可根据可用的培训数据量进行调整.但 ...
- 《Channel Pruning for Accelerating Very Deep Neural Networks》论文笔记
1. 概述 这篇文章提出了一种基于LASSO回归的通道选择和最小二乘重构的迭代两步算法,有效地对每一层进行修剪.并进一步将其推广到多层和多分枝的场景下.论文中的方法能够减少累积误差并且提升对于不同结构 ...
- Paper:《Generating Sequences With Recurrent Neural Networks》的翻译和解读
Paper:<Generating Sequences With Recurrent Neural Networks>的翻译和解读 目录 Generating Sequences With ...
- CV:翻译并解读2019《A Survey of the Recent Architectures of Deep Convolutional Neural Networks》第一章~第三章
CV:翻译并解读2019<A Survey of the Recent Architectures of Deep Convolutional Neural Networks>第一章~第三 ...
- Paper:Xavier参数初始化之《Understanding the difficulty of training deep feedforward neural networks》的翻译与解读
Paper:Xavier参数初始化之<Understanding the difficulty of training deep feedforward neural networks>的 ...
- Paper之DL之BP:《Understanding the difficulty of training deep feedforward neural networks》
Paper之DL之BP:<Understanding the difficulty of training deep feedforward neural networks> 目录 原文解 ...
- 论文笔记(一)《Intriguing properties of neural networks》
对抗样本(一)<Intriguing properties of neural networks> 神经网络的有趣特性 两点: 性质1:单个的深层神经元与随机线性组合的多个深层神经元并没有 ...
- 《Intriguing properties of neural networks》代码实现——Pytorch
<Intriguing properties of neural networks>代码实现--Pytorch 一.代码实现 #导入库 import torch import torch. ...
最新文章
- 【JavaScript】JavaScript基础-变量、运算符与控制语句
- 深入讲解MPLS/×××技术原理
- javascript漏洞-检测到目标站点存在javascript框架库漏洞
- 有趣的MS Live Labs
- python扫雷的代码及原理_基于Python实现的扫雷游戏实例代码
- 一文了解OOM及解决方案,你还看不明白?
- 【牛客 - 551E】CSL 的魔法(贪心,思维,STLmap,分块)
- Kubernetes 诞生七年,凭什么成为主流?
- SpringBoot中@Email报错解决
- 阿里面试官:分别说说微信和淘宝扫码登录背后的实现原理?
- usb声卡驱动_最适合专业音乐人网络直播的声卡型号
- redis-trib.rb 搭建集群
- intel ax200ngw刷killer 1650x教程
- 小白也能懂的hadoop生态圈,很黄很暴力!
- Word排版——毕业论文专业排版5——目录
- 哪个程序猿还没段风花雪月的错过
- 哈工程计算机考研复试各科总分,考研复试总分是多少
- c++ 箭头符号怎么打_c++笔记--重载箭头运算符
- linux svn e170001 认证失败,jenkins - svn: E170001报错的原因以及解决方案
- 基于51单片机篮球计分器proteus仿真设计
热门文章
- GPIO 错误 提示
- ubuntu中的坑——ubuntu18.04版本下安装NVIDIA显卡驱动
- Android学习小记-----拦截电话/拒接电话,规避拒接电话前响一声或者两声的问题...
- Unity 工具类 之 简单快速 获取当前所在位置,所在城市,经纬度等
- 利用canvas画布画哆啦A梦
- 鸿蒙和苹果拍照对比,iPhoneSE/11/XR拍照对比:差距依然比想象的大多了
- 如何搜索微信号或者手机号去添加企业微信?
- 【数据集】驾驶员分心检测数据集(State Farm Distracted Driver Detection)
- 保留两位小数正则表达式
- 现在普通家用计算机的运算速度,中国目前运算速度最快的计算机