tags: 单目深度估计,论文阅读,DORN


原始论文是:

Deep Ordinal Regression Network for Monocular Depth Estimation
Huan Fu1 Mingming Gong2,3 Chaohui Wang4 Kayhan Batmanghelich2 Dacheng Tao1 Huan Fu1 Mingming Gong2,3 Chaohui Wang4 Kayhan Batmanghelich2 Dacheng Tao1

在线看论文:

https://arxiv.org/pdf/1806.02446.pdf

在线看代码


过往的DCNN方法的失败之处

过往的工作(特指那些 使用 深度 神经网络的:DCNN)方法的3种失败处:

  • 收敛慢
  • 局部解析度不够,就是你在最后的深度图上,看不清很多边缘
  • 网络里面 有许多 重复的 pooling 操作。计算,内存要求多

我们提出一些方法来针对上述问题

方法1: SID

背后的想法就是: 远处的就分类粒度粗一些

那么,在这个 「SID 远处的就分类粒度粗一些 」的基础上,就能把回归问题 变成 一个 分类问题。

离散化 连续 的 距离 变为 一些 距离间隔。

我们的模型包含什么

分成3个模块

  1. 特征提取的模块
  2. 场景理解的模块
  3. 有序回归的模块

特征提取模块

包含:

全面的图片编码器

full-image encoder

场景理解模块

ASPP

空洞卷积??

有序回归 模块

这里就是 用到 了SID

上图说的 eq1
, 等式 1 ,就是:

如何完成学习和推断

学习阶段

定义我们特有的损失函数:

迭代的优化算法,反向传播 ,我们最后就能得到一个 「有序的 label 分类」,每个类就是一个距离,比如:1m, 1.1m, 1.2m, 1.4m, 2m, 10m, 50m; 这个距离 跟上面 的SID 有关。

推断阶段

有了 : 有序的 label 分类, 就可以进行 距离推断。

用下面的公式:

  • 解释一下:

d 尖就是 推测的 depth/ 距离

l 就是 学习到 的label

DORN 的表现很好

在18 年的原始论文里,有这个数据:

在 21年的 kitti 排行榜,很靠前

其实,按照 absRel , DORN 排名第一

备注: 指标 解释

更多相关可以读的博客:

todo 2021-09-08 16:45:30

论文笔记

论文详细笔记

2019CVPR单目深度估计综述

DORN的论文行文不好,但是看看代码,思路还是挺牛逼的,来自2020年看法

这篇论文在ROB2018的视频

yoiuytube

过往的方法

  • patch
  • eigen; loss function;

regression loss

我们的方法

是 ordinal regression loss

loss functions

MSE

mean square error:

但是 mse 这玩意 的 不好的地方就是: 对于 outliers ,也就是 那些 离开群体 的点,它很敏感,很容易 受离群点 的影响。

更加 robust 的loss function

  • mse_log

  • mae


这些 loss 函数,都是 为了 regression 设计的。

那么我们有一个 发问:

难道不能设计 分类,有序回归 问题的loss 函数吗?

距离的 离散化


在这个 图片 ,地下 的 sid 就是我们 提出的 间隔话 的方式。

就会得到这样的回归结果


收敛速度

多解析 架构;网络部分

多尺度特征提取器

四个评价指标

结果


提问环节的一些记录

如果更换一个全新的场景怎么办?

训练 是 用 kitti 和 cityscape 这两个数据集‘

但是如果其他场景呢?比如 更加 landscape 的场景;

回答是:

你需要自己进行 新的 标注;因为这是一个 有 监督 的 算法;

你用了什么 loss function?

我用了 图中的第一个

后面三个 没用

loss 函数 和 离散化 谁更重要?

它们在我们的工作中都 贡献了许多,但是我觉得 loss 函数 会更加重要一些。

多分类器,以及空间增加的离散化,的对比实验

结论都写在图中的底下两行了。

dorn + sid 就是 会好很多。

更多 可以观看的视频

todo : 2021-09-08 16:37:37

通过视频序列进行深度估计

在Azure上的「有序回归」学习

Deep Ordinal Regression Network for Monocular Depth Estimation 单目深度估计,论文阅读,DORN;视频笔记相关推荐

  1. 面向单目深度估计的基于几何的预训练方式 -- Geometric Pretraining for Monocular Depth Estimation

    一些前提知识 Monocular Depth Estimation:单目深度估计,从单张图片中去预测每个像素点具体的深度,相当于从二维图像推测出三维空间. ImageNet-Pretraining:基 ...

  2. 单目深度估计(Monocular Depth Estimation)论文阅读 2021-01-15

    单目深度估计 问题公式化:求非线性映射函数 一.数据集: NYU Depth:视频序列和dense depth map通过RGB-D采集的,但是不是每一种图像都有深度图,因为映射是离散的. KITTI ...

  3. 无监督单目深度估计 Unsupervised Monocular Depth Estimation with Left-Right Consistency 论文方法分析

    最近在做深度估计相关的毕业设计,一般的基于深度学习单目深度估计算法都是基于监督学习的方法,也就是说我希望输入一张拍摄到的单目照片,将它通过卷积神经网络后生成一张深度图.在这个过程中我们就要求需要有大量 ...

  4. 单目深度估计 | Real-Time Monocular Depth Estimation using Synthetic Data 学习笔记

    文章目录 1. 摘要 2. 创新点和局限性 3 研究 3.1 阶段1-单目深度估计模型. 3.1.1 损失函数 3.1.2 训练细节 3.2 阶段2-通过风格迁移的域自适应 3.2.1 损失函数 3. ...

  5. 基于分段平面性的单目深度估计 P3Depth: Monocular Depth Estimation with a Piecewise Planarity Prior

    P3Depth: Monocular Depth Estimation with a Piecewise Planarity Prior 面向可解释深度网络的单目深度估计 0 Abstract   单 ...

  6. 单目深度估计综述: Monocular Depth Estimation survey

    深度估计很重要,sfm和mvs都是建立在多个视图的特征匹配的基础上,预测出来的深度图还很他妈稀疏,说实话从单个图像推出深度就是不适定的扯淡问题.但是没办法,话是要用深度学习搞 啊,于是乎不同的网络结构 ...

  7. 单目深度估计 | Learning Depth from Monocular Videos using Direct Methods 学习笔记

    文章目录 摘要 1. 论文主要贡献: 2. 从视频中学习预测深度 2.1 尺度模糊 2.2 建模姿态估计预测器 3. 可微分直接视觉测距法 3.1 直接视觉测距法(DVO) 3.2 可微分的实现 4 ...

  8. 单目深度估计数据集:NYU Depth Dataset V2

    论文:Indoor Segmentation and Support Inference from RGBD Images 数据集:NYU Depth Dataset V2数据集 打不开或者下载慢的可 ...

  9. Monocular Depth Estimation UsingLaplacian Pyramid-Based Depth Residuals翻译

    基于拉普拉斯金字塔深度残差的单目深度估计 Monocular Depth Estimation UsingLaplacian Pyramid-Based Depth Residuals英文注解: 基于 ...

最新文章

  1. 学python要有多少英语词汇量测试_“扫地僧”!自学Python编程、英语词汇量15000……北大保安再上热搜...
  2. AtCoder AGC030B Tree Burning
  3. 对口高考计算机vf试题,计算机对口升学模拟答案.doc
  4. python爬虫数据可视化_python 爬虫与数据可视化--python基础知识
  5. Python爬取B站5000条视频,揭秘为何千万人看「哪吒」流泪
  6. Maven 项目在 Eclipse 的创建配置
  7. 记一次详细的的SQL查询经历,group by慢查询优化
  8. epoll和poll的C++11多线程练习
  9. ITU-T Technical Paper: QoS的构建模块与机制
  10. 【指纹识别】基于matlab GUI指纹识别【含Matlab源码 586期】
  11. 【Hadoop】Hadoop大数据架构及关键组件
  12. BAT的校园大赛,都秀出了哪些肌肉?
  13. 南京掌上公交一款好用的手机app
  14. 丧心病狂的外挂:透视穿墙,带老板坐飞机,打不过就炸房
  15. webpack雪碧图生成
  16. 转 shell编程100例
  17. 【SAP消息号L9006】
  18. 网络基础(四) — QUIC协议
  19. TraceBack的用法
  20. bigdata101:Permission denied (publickey .....) 这次的不一样

热门文章

  1. UDID与OpenUDID的区别联系
  2. 从护士“逆袭”微软中国总裁,打工女皇消失20年后重出江湖回应2亿年薪传闻...
  3. pytorch学习资源汇总
  4. 代码臃肿已成常态:99% 计算机资源都被浪费掉了
  5. 如何禁止pdf复制修改打印
  6. java 创建临时临时文件
  7. Mongodb常用查询语句_笔记
  8. 如何正确关机,重启,以及常用的快捷键
  9. Android 反编译 vdex/odex转换dex
  10. 统一威胁管理设备代表产品详细介绍(转)