RGBD模态融合问题
当图像特征中RGB图像和depth图像特征有鸿沟时,怎么进行融合呢?这里从RGBD SOD显著性检测的领域找了一些最新论文的方法,并附上代码,以供参考。
1、2022 Multi-modal interactive attention and dual progressive decoding network for RGB-D/T salient object detection
GitHub - Liangyh18/MIA_DPD
三、2021 CDNet: Complementary Depth Network for RGB-D Salient Object Detection
GitHub - blanclist/CDNet
![](/assets/blank.gif)
https://github.com/MathLee/HAINet
五、21 RGB-D Salient Object Detection via 3D Convolutional Neural
3D CNN聚合广泛信息的能力。将depth模态作为RGB的另一个“时间状态“,通过3D CNN聚合两种模态的信息,使得在解码器阶段显式融合,且不需要再设计复杂的跨模态融合模块。
六、2015 Siamese Network for RGB-D Salient Object Detection and Beyond
协同融合(加法、乘法)GitHub - kerenfu/JLDCF: Code for CVPR-2020 paper "JL-DCF: Joint Learning and Densely-Cooperative Fusion Framework for RGB-D Salient Object Detection"
“⊕”利用了特征的互补性,而“⊗”更强调特征的共性 。可视为一种residual attention
七、2020 Learning Selective Mutual Attention and Contrast for RGB-D Saliency Detection
选择性互注意与对比(SMAC)模块(融合了两个模态的互注意力机制和对比机制(前后景对比),还用了选择性注意力自适应调整深度图融合所占的权重)
GitHub - nnizhang/SMAC: ReDWeb-S: a large-scale challenging dataset for RGB-D Salient Object Detection.
八、2020 Is Depth Really Necessary for Salient Object Detection?
信道感知融合模块(CAF),它可以自适应地选择鉴别特征来进行对象理解。
DASNet 2020 (cvteam.net)
九、2020 Feature Reintegration over Differential Treatment: A Top-down and Adaptive Fusion Network for RGB-D Salient Object Detection
提出了两种模块分别针对高层级特征和低层特征的融合
IFM专注于结合来自两种高水平模态的全局信息,而GSFM的目标是通过“在低水平中删除不必要的信息来融合有用的本地信息。
IFM如下图,因为高层特征细节不多,所以不用很复杂:
GSFM(门控选择融合模块)如下图,
并且每一层特征融合时都引入了监督:
十、2020 Depth Quality Aware Salient Object Detection
主要不是特征融合,是怎么得到有贡献的深度特征: 多加一流进行监督学习,学习到深度图中有、但RGB中没有的、对saliency map的贡献。
精髓在于用这样的pGT = {P + B}的损失函数进行监督
十一、2020 Data-Level Recombination and Lightweight Fusion Scheme for RGB-D Salient Object Detection
将原始的四维RGB-D循环转换为DGB、RDB和RGD。
RGBD模态融合问题相关推荐
- 多模态深度学习综述:网络结构设计和模态融合方法汇总
点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者丨小奚每天都要学习@知乎(已授权) 来源丨https://zhuanlan.zhihu.com/p ...
- 工程(八)——yolov5可见光+红外双模态融合(代码)
目录 引言 一.数据集融合 1.1 直接权重融合 1.2 TIF融合方法 二.结果集融合 2.1 整体代码框架 2.2 标定参数 2.3 选择最优检测框 2.3.1 检测框合并 2.3.2 重复检测框 ...
- ECCV2020 | 北京大学提出RGB-D语义分割新网络,多模态信息融合
点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 这篇文章收录于ECCV2020,由北京大学.商汤科技.香港中文大学提出的基于RGB-D图像的语义分割算 ...
- Open3d学习计划—高级篇 5(RGBD融合)
Open3D是一个开源库,支持快速开发和处理3D数据.Open3D在c++和Python中公开了一组精心选择的数据结构和算法.后端是高度优化的,并且是为并行化而设置的. 本系列学习计划有Blue同学作 ...
- RGBD融合原理及实践
RGBD融合原理及实践 前言 原理部分 实践 前言 好久没更新博客了,主要是因为懒,最近有些得闲,决定纪录下之前的工作.RT,RGBD数据融合其实就是将3D摄像机的RGB与Depth数据做融合显示的过 ...
- Hierarchical Fusion Model (2019 ACL)三种模态的层次融合
论文题目(Title):Multi-Modal Sarcasm Detection in Twitter with Hierarchical Fusion Model 研究问题(Question):主 ...
- 用于RGB-D显著目标检测的自监督表示学习
点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 小白导读论文是学术研究的精华和未来发展的明灯.小白决心每天为大家带 ...
- 基于三维卷积神经网络的RGB-D显著目标检测
点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 小白导读论文是学术研究的精华和未来发展的明灯.小白决心每天为大家带 ...
- 大连理工IIAU Lab提出SSLSOD:自监督预训练的RGB-D显著性目标检测模型(AAAI 22)
作者丨Lart 编辑丨极市平台 导读 本文在显著性目标检测任务(SOD)中,首次引入自监督预训练.凭借提出的有效的前置任务(pretext task),在仅使用少量无标签的RGB-D数据进行预训练的情 ...
最新文章
- 黑客基础知识与防护(二)
- 6. Leetcode 11. 盛最多水的容器 (数组-双向双指针)
- a good website to test OTP
- B站举办2021年度百大UP主盛典 科技知识类UP主占比翻倍
- unable to locate package vi_什么是VI设计?
- pl/sql实现打印九九乘法表
- matlab随机欠采样,欠采样技术
- android+关闭屏幕旋转,Android:即使设备自动旋转屏幕关闭,如何强制反向纵向?...
- docker之SonarQube导出PDF报告
- C/C++中的函数参数传递机制 作者:杨宁 发布时间:2000/11/30
- 移动硬盘文件夹不见了怎么办?
- html5人脸拼图,layout拼图
- Oracle aes128和aes256加解密
- UDP传输rtp数据包丢帧
- hp-ux系统备份与恢复常用命令
- 北宋三司若干问题研究
- 《吴军信息论40讲》学习笔记(完)
- 效能评估指标体系构建
- SAP ABAP性能优化 - 调优工具 SM50 | ST05 | SAT
- MongoDB基础-张晓飞-专题视频课程