论文名字:Towards Efficient and Scale-Robust Ultra-High-Definition Image Demoir´eing
论文下载地址:https://arxiv.org/abs/2207.09935
论文代码地址: https://xinyu-andy.github.io/uhdm-page

论文内容:获取多语义信息并交互融合以处理超高清图像去摩尔纹。

具体内容:随着拍照设备的进步,超高清图像的获取更加容易,也对超高清图像的去摩尔纹技术提出了新的要求:处理负担小、处理分辨率高。

现有方法都是从低分辨率图像上训练和测试,在4K图像上难以去除摩尔纹,但他们也能承受对应的计算成本(即方法的计算成本可负担但效果欠佳),作者认为这些方法欠缺多尺度特征的有效提取策略(可能还有融合策略)。

**笔者观点:**去摩尔纹有种常用的方法是将输入下采样(通常是两次)放到对应的三个分支中,分辨率大小的改变意味着语义信息的不同,最直观的感受是同样10×10大小的感受野,缩略图看到的是一个结构而高清图看到的只是细节,此外同一分支中随着卷积的增加,语义信息也在发生改变。而分支之间的交互也即语义之间的交互都放在输出阶段,缺少有效交互和融合。因此作者想从这一点下手解决问题。

提出的方法一共分三点:DRDB模块、SAM模块、损失函数。整体结构框架如下(图画的真不赖):

DRDB(Dilated Residual Dense Block)

老面孔了,就是简单的密集块加空洞卷积,最后使用残差链接,感兴趣的可以查看这篇内容:残差密集块。

SAM(Semantic-Aligned Scale-Aware Module)

这是作者提出的模块,也是解决多尺度(语义)的核心。由两个小模块组成,分别是: pyramid feature extraction 和cross-scale dynamic fusion

Pyramid feature extraction

首先对输入使用双线性差值进行下采样,然后经过扩展密集块(密集块+空洞卷积)再经过一个卷积层,由于这里的模块结构一样,因此参数也可以共享。为了保持输出的大小一致,因此增加了双线性差值上采样得到结果 Y 0 , Y 1 , Y 2 Y_0,Y_1,Y_2 Y0​,Y1​,Y2​

Cross-scale dynamic fusion

对上一个模块的输出在空间维度做一个GAP,得到每一个channel一个值,拼接起来,过三层全连接层,分解回三个尺度,再对上一个模块的输出做一个相乘的操作,最后是一个残差链接。

**笔者观点:**这里其实就是一个channel-attention的操作。因为4K图像的分辨率很高,而摩尔纹的尺度范围也很大,可以是很大范围的摩尔纹也可以是一个很小范围内的摩尔纹,每张图像的侧重都不一样,因此需要做一个attention的操作,这点在论文中可以得到印证。但是我感到疑惑的是为什么不是把三个尺度各自作为一个整体而是全部channel都看作是单独的元素(如果这里不是做3分支而是做成5分支甚至50分支,操作都是一样的,并没有体现出三分支的特点)可能是模型足够强大可以学到最优的参数?此外,对齐不清楚体现在哪里?

损失函数

采用深度监管策略,简单讲就是在中间层加入分支对主干网络进行监督,感兴趣的可以查看 深度监管策略,在该模型中则是获得三种尺度的输出图像,具体见整体结构框架图像。同时对语义信息采取感知损失。

Experiments

数据集:FHDM i、TIP2018、LCDMoire、UHDM
评价指标:PSNR、SSIM、LPIPS

定量/定性


消融实验

A代表SAM中两个模块都没有
A+代表SAM中两个模块都没有,但是参数两调整到和E一致
B代表有金字塔上下文提取,且共享参数
D代表有金字塔上下文提取,不共享参数
C代表有跨尺度动态融合
E代表拥有全部组件的模型

金字塔上下文提取,且共享参数
D代表有金字塔上下文提取,不共享参数
C代表有跨尺度动态融合
E代表拥有全部组件的模型

Towards Efficient and Scale-Robust相关推荐

  1. Reproducible Research in Computational Science

    Reproducible Research in Computational Science from: http://www.csee.wvu.edu/~xinl/source.html " ...

  2. 计算机视觉,图像处理 经典代码paper整理(很全很强大!)

    转自:Jia-Bin Huang 同学收集了很多计算机视觉方面的代码 ,链接如下: https://netfiles.uiuc.edu/jbhuang1/www/resources/vision/in ...

  3. 2000 ~2019 年历届 CVPR 最佳论文汇总

    原文链接:http://bbs.cvmart.net/topics/665/CVPR-Best-Paper 本文汇总了从 2000 ~ 2019年历届 CVPR 会议最佳论文,附上作者和论文链接(论文 ...

  4. NeurIPS 2020 所有RL papers全扫荡

    文 | 微尘-黄含驰 源 | 知乎 论文列表 1.<Breaking the Sample Size Barrier in Model-Based Reinforcement Learning ...

  5. 计算机视觉论文-20210223

    本专栏是计算机视觉方向论文收集积累,时间:2021年2月23日,来源:paper digest 欢迎关注原创公众号 [计算机视觉联盟],回复 [西瓜书手推笔记] 可获取我的机器学习纯手推笔记! 直达笔 ...

  6. SLAM 论文阅读和分类整理

    前言:以前读论文,都是靠脑子硬记,哪个实验室,谁,哪一年在什么会议上发了一篇关于什么的论文.当需要回溯的时候,每篇论文能给出个大概,不具体,找起来也麻烦,以后就在这个 List 里分类整理已经读过的论 ...

  7. ECCV2022论文列表(中英对照)

    Paper ID Paper Title 论文标题 8 Learning Uncoupled-Modulation CVAE for 3D Action-Conditioned Human Motio ...

  8. 【转】SLAM 论文阅读和分类整理

    需要时不时膜拜一下大神,激发一下原动力!!! 前言:以前读论文,都是靠脑子硬记,哪个实验室,谁,哪一年在什么会议上发了一篇关于什么的论文.当需要回溯的时候,每篇论文能给出个大概,不具体,找起来也麻烦, ...

  9. 视觉SLAM论文list

    视觉SLAM论文list 转载:https://blog.csdn.net/heyijia0327/article/details/82855443 基础知识材料 2018年, joan sola 大 ...

  10. (十五:2020.08.28)CVPR 2013 追踪之论文纲要(译)

    讲在前面 论坛很多博客都对论文做了总结和分类,但就医学领域而言,对这些论文的筛选信息显然需要更加精细的把控,所以自己对这200篇的论文做一个大致从名称上的筛选,希望能找到些能解决当前问题的答案. 论文 ...

最新文章

  1. 9月21日科技联播:报告显示网约车案发率低于传统出租车;刘强东性侵案已移交美国检方...
  2. docker 命令详细解释
  3. 从零开始--系统深入学习android(实践-让我们开始写代码-Android框架学习-2.service)...
  4. linux挂载盘符扫描,Linux下挂载ISCSI的盘符问题
  5. OceanBase再破纪录!核心成员陈萌萌:坚持HTAP就是坚持我们做数据库的初心
  6. android bitmap对比,Android Bitmap和Drawable的对比
  7. linux分辨率 保存,linux分辨率设置方法与问题-linux分辨率的设置方法分享-linux修改分辨率的经验分享_169IT.COM...
  8. 基础之 window-self-top-opener
  9. 温州大学c语言作业布置的网站,2016年温州大学物理与电子信息工程学院综合卷之C语言程序设计复试笔试仿真模拟题...
  10. cs231n学习记录
  11. 对话仟峰资本Steven:DeFi大赢家是怎样炼成的 |链捕手
  12. android怎么防8门神器,八门神器怎么使用?安卓八门神器教程
  13. GB2312编码范围
  14. 第 4 篇、Linux操作基础 | 计算机组成
  15. 猫小胖服务器位置,最终幻想14新增猫小胖大区拆分陆行鸟大区-最终幻想14国服大区调整计划公布!-Appfound...
  16. C++string字符串初始化与使用
  17. Vue实例详解与生命周期
  18. SQL常用检索语句清单
  19. 汽车行业怎么样才能引流?
  20. python中用dict和dict.keys()查找目标值的不同

热门文章

  1. 东南大学计算机系考研难度,东南大学研究生好考吗 都有哪些专业
  2. RTN卫星轨道坐标系、UNW、VVLH区别
  3. QQ浏览器使用infinity新标签
  4. jsp+tomcat+mysql+sevlet+javabean配置过程
  5. Python-MongoDB
  6. zoj 1010 Area【线段相交问题】
  7. 仿微信通讯录滑动定位ListView功能
  8. 印度邦政府计划采用区块链技术减轻政府欺诈行为
  9. win7 MW300U 共享wifi
  10. 格力造车梦碎,终止筹划发行股份收购珠海银隆