Distort-and-Recover: Color Enhancement using Deep Reinforcement Learning

  • 摘要
    • Introduction
    • Problem Formulation
    • Automatic Color Enhancement
      • Features
      • agent
      • Distort-and-Recover Training Scheme
    • 结果

)

摘要

提出了一个基于深度强化学习的方法,用于颜色强化;将颜色强化看做一个马尔科夫决策,然后训练一个agent,去学习每步中最优的全局强化序列;此外,还提出了一个“失真-复原”的训练方案,仅需要高质量的参考图像用于训练(不用input-retouched图像对)

Introduction

本文提出了一个自动进行色彩强化的方法. First,提出了深度强化学习DRL对色彩强化(如下图)。将色彩强化问题看作一个马尔科夫决策MDP,每步行为(选择白平衡、上下文、亮度等操作)都可看做一个全局的颜色调整操作。它是一个迭代的过程,类似于人类一步一修图。之后使用DQN来解决MDP问题。

Second
提出了一个“distort-recover”训练方案。仅仅通过一系列的高质量参考图片来学习色彩强化。随机地对参考图像进行畸变,产生“distort-and-recover’”图像对。
Contributions
1.色彩强化agent可在无监督的情况下学习每次的润饰action。
2.提出“distort-and-recover”方案训练agent。
3.可在不知道色彩分配的情况下强化图像。
加粗文本 加粗文本
标记文本

引用文本

Problem Formulation

作者将输入图像记: I;
对其进行的调整action记为:A;
图像I(t)表示第t次使用上下文特征Fcontext(I(t))和全局色彩特征Fcolor(I(t))的图像;
A(t)表示每一次根据决策Ωθ确定的action;
状态S是上下文特征和色彩特征(Fcontext,Fcolor)的组合;
action space是一系列的A;
另外采用专家修饰的图像Itarget作为ground truth,将图像I(t)和图像Itarget的negative L2距离看做色彩审美指标。
最终目的是找到最优的色彩强化序列actions T{Aoptimal(t)⊂A},使得 最小

立即回报函数:当R(t)大于0时,表示第t次润饰的结果比前一次的好,给予一个正向激励;当R(t)小于0时,表示第t次润饰的结果比前一次的差,给予一个负向激励;

效用函数:表示在第t次润饰时选用action A对未来的影响;在训练agent时,根据Q(S(t),A)的值(值越大表示润饰效果越好)选择action

Automatic Color Enhancement

使用预训练的CNN对图像I(t)提取上下文特征和色彩特征,之后将提取的特征输入到agent网络,agent选择最优的action A(作者预先定义了12个actions),直到所有的action的值都为负数时才停止。

Features

上下文特征:选择VGG-16第六层的4096维激活做为上下文特征
色彩特征:采用CIELab颜色直方图,将CIELab空间的每个轴线性量化到20间隔,然后计算落入每个间隔的像素数,得到一个20X20X20维的直方图。

agent

由一个3层的多层感知器组成,并且每层均使用一个ReLu激励函数,使用公式一来训练agent,而决策Ωθ是由ϵ-贪心算法(ϵ=0)决定的.

Distort-and-Recover Training Scheme

对高质量的参考图像进行随机的色彩操作使其失真,得到伪输入-修饰图像对。

  1. 为了在有效的搜索空间提供更清晰的监督信号,在CIELab颜色空间上,将失真图像与参考图像的L2距离保持到10-20之间
  2. 为了防止色彩偏差,使用与DRL-agent动作集不同的全局动作:高光像素/阴影像素上的亮度/上下文/色彩饱和的调整;高光像素C/M/Y/R/G/B上的C/M/Y/R/G/B操作.
  3. 在选择高光像素/阴影像素时,使用soft-像素选择的方法,该方法利用一个变型的sigmoid函数,对高像素/低像素施加较高的权重。
  4. 还使用了基本的亮度/上下文/色彩饱和操作。
  5. 还考虑了简单性。

结果

选择不同特征的结果:

基于input-retouched图像对的不同方法结果对比:

以Pix2Pix为基线的对比结果:

与专家A、B、C、D、E的修饰结果对比:
不同修饰结果对比:

Distort-and-Recover: Color Enhancement using Deep Reinforcement Learning相关推荐

  1. 【论文翻译】Distort-and-Recover: Color Enhancement using Deep Reinforcement Learning

    ABSTRACT: 本文提出--人类修图是按照步骤逐渐进行的序列,于是用MDP建模,训练agent得到一个最优的动作序列.此外,我们提出了一种"失真-复原"训练方案,只需要高质量图 ...

  2. ReLLIE Deep Reinforcement Learning for Customized Low-Light Image Enhancement

    文章目录 ReLLIE Deep Reinforcement Learning for Customized Low-Light Image Enhancement 0 Abstract and In ...

  3. 深度强化学习综述论文 A Brief Survey of Deep Reinforcement Learning

    A Brief Survey of Deep Reinforcement Learning 深度强化学习的简要概述 作者: Kai Arulkumaran, Marc Peter Deisenroth ...

  4. 基于深度强化学习的车道线检测和定位(Deep reinforcement learning based lane detection and localization) 论文解读+代码复现

    之前读过这篇论文,导师说要复现,这里记录一下.废话不多说,再重读一下论文. 注:非一字一句翻译.个人理解,一定偏颇. 基于深度强化学习的车道检测和定位 官方源码下载:https://github.co ...

  5. Deep Reinforcement Learning: Pong from Pixels翻译和简单理解

    原文链接: http://karpathy.github.io/2016/05/31/rl/ 文章目录 原文链接: 前言 Policy-Gradient结构流程图 Deep Reinforcement ...

  6. 论文笔记之:Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning

    论文笔记之:Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning  2017-06-06  21: ...

  7. Deep Reinforcement Learning 深度增强学习资源

    http://blog.csdn.net/songrotek/article/details/50572935 1 学习资料 增强学习课程 David Silver (有视频和ppt): http:/ ...

  8. 深度强化学习(Deep Reinforcement Learning)的资源

    深度强化学习(Deep Reinforcement Learning)的资源 2015-04-08 11:21:00|  分类: Torch |  标签:深度强化学习   |举报 |字号 订阅 Goo ...

  9. 利用Deep Reinforcement Learning训练王者荣耀超强AI

    Mastering Complex Control in MOBA Games with Deep Reinforcement Learning (一)知识背景 (二)系统架构 (三)算法结构 3.1 ...

最新文章

  1. 怎样设定目标(五)——设定目标失败的七大原因
  2. css hack方法,css hack怎么应用
  3. mybatis 忽略实体字段_27道mybatis面试真题,你能答对几道?
  4. python图形化界面按钮_Python-PyQt5-图形可视化界面(3)--按钮--Qpushbutton
  5. UIView编程体验(一)
  6. https访问http加载不出图片_前端解决第三方图片防盗链的办法
  7. 大专学历造假改成了211, 拿到了抖音Offer
  8. UE3 光照 阴影
  9. html弹窗_对付流氓广告弹窗:彻底告别,这一招最有效
  10. AI需要你帮忙 | 把两栖爬行动物框出来,提高AI识别准确率
  11. sans webcast
  12. 2019美赛C题论文解读
  13. latex模板章节序号标签加粗
  14. 最简单DIY基于Android系统的万能蓝牙设备智能遥控器
  15. 全球IP地址分配对应表
  16. 北京邮电计算机课程表,(北邮通信工程本科专业课程表.doc
  17. AD20.0.13初学
  18. speedoffice(表格)怎么插入文本框?
  19. 网站怎么样对接微信公众号,看以下操作
  20. ccna路由器部分总结

热门文章

  1. python-16-名片管理系统
  2. ccf-CSP 202209
  3. c语言rtp协议,RTP系列:RTP协议详解和分析
  4. 《视觉SLAM十四讲》手写高斯牛顿—笔记记录
  5. 羊毛出在狗身上猪来买单
  6. Mybatis配置分页插件
  7. 把WinXP系统升级到Win7的方法
  8. python中rstrip 函数,Python rstrip()方法实例详解
  9. Python中strip()、lstrip()、rstrip()用法
  10. 揭示了什么_Nature子刊:生信分析揭示吸血蝙蝠为什么能以血液作为唯一营养来源...