下载地址:Arxiv 2022.11.23
Code地址:https://github.com/zyxElsa/creativity-transfer

1. Introduction

Motivations

  1. 以前的任意示例引导的艺术图像生成方法(比如风格迁移)通常无法控制形状变化或传达语义元素。而预训练的text-to-image diffusion需要大量的文字描述才能准确描绘特定绘画的属性。
  2. 本文的核心思想是从一幅画中学习艺术创造力,然后在不提供复杂的文字描述的情况下指导生成过程。

Arguments

  1. Style Transfer不能传递对象形状和语义元素等特定的创意属性。如图中的b,e
  2. Text-guided Stylization从自然图像和文本提示中生成艺术图像,但是通常目标风格的文本提示只能是对材料的粗略描述。如图中a,d
  3. Diffusion模型虽然可以生成高质量的结果,但是除了输入图像之外,如果我们想要再现一些生动的内容和风格,还需要详细的辅助文本输入来指导生成过程,这可能仍然难以在结果中再现特定绘画的创意

Contributions

  1. 本文提出了一种新任务:艺术创造力迁移的任务(Creativity Transfer)。给定一个单一的绘画图像,目标是通过使用自然图像或文本描述来控制内容,生成对其创作属性具有高保真度的新艺术图像。
  2. 本文提出了一种基于注意力的单图像文本反转方法,可以快速准确地学习图像的整体语义和艺术技巧,从而捕捉绘画的完整创意。
  3. 通过实验证明本文提出的创造性学习方法可以实现SOTA的性能和新颖的视觉效果

2. Methodology

主要思想是通过Textual Inversion将输入的艺术图像进行处理,得到其对应的包含了creativity的文本v,然后将v进行embedding后作为预训练好的Diffusion的条件输入。

2.1 Textual Inversion

做法是对于输入的条件图像y,利用CLIP image Encoder τ θ ( y ) \tau_{\theta}(y) τθ(y) 得到其对应的embedding,然后经过Attention后输出的v作为Diffusion要用的文本条件,经过Text encoder编码之后作为Diffusion的条件输入。

训练的目标则是Diffusion的目标

而在训练的时候, τ θ \tau_{\theta} τθϵ θ \epsilon_{\theta} ϵθ 的参数是固定的。

2.2 Stochastic Inversion

本文指出,LDM生成图像的整体性由文本条件控制,而细节则有加入的噪声控制,因此本文固定了随机种子。

这个部分原文写的不太清楚,事实上本文我只给了两个S的一个重要原因就是文章好几个地方写的很不清楚,包括整体的训练和采样过程也没有详细给出。实验部分也是只有效果图,没有指标的比较。

3. Experiments

033_SS_Inversion-Based Creativity Transfer with Diffusion Models相关推荐

  1. 2022年11月100篇 diffusion models 扩散模型 汇总!

    在生成图像方面,自从NIPS 2014的一篇开山之作: Generative Adversarial Nets 论文:https://proceedings.neurips.cc/paper/2014 ...

  2. 井喷式爆发!2022年11月100篇 diffusion models 扩散模型 汇总!

    点击上方"摸鱼吧算法工程师"卡片,关注星标 获取有趣.好玩的前沿干货! 001  (2022-11-30) Maximum Likelihood Estimation for a ...

  3. Diffusion Models和GANs结合

    Diffusion Models专栏文章汇总:入门与实战 前言:作为Diffusion Models最成功的前辈们:flow based models.VAEs.GANs,最近几个月已经有不少将dif ...

  4. Diffusion Models专栏文章汇总:入门与实战

    最新最全Diffusion Models论文.代码汇总 1.Diffusion Models扩散模型与深度学习(数学原理和代码解读) 这篇文章适合小白入门看,能快速了解diffusion models ...

  5. 论文笔记High-Resolution Image Synthesis with Latent Diffusion Models

    论文提出了latent diffusion models (LDMs).基于该模型最著名的工作是文本生成图像模型stable-diffusion. 普通的扩散模型在像素空间操作,运算复杂度较高.为了保 ...

  6. 生成模型(四):扩散模型(Diffusion Models)

    本文大纲如下: 生成模型种类 到目前为止,我已经写了三种类型的生成模型,[[生成模型-GAN]].[[生成模型-VAE]]和[[生成模型-Flow based model]]. 它们在生成高质量样本方 ...

  7. [论文解析] Cones: Concept Neurons in Diffusion Models for Customized Generation

    论文连接:https://readpaper.com/pdf-annotate/note?pdfId=4731757617890738177&noteId=171536153627444352 ...

  8. 详细解读Latent Diffusion Models:原理和代码

    Diffusion Models专栏文章汇总:入门与实战 前言:CVPR 2022中的一项新工作latent diffusion models引起了广泛关注,提出了两段式diffusion model ...

  9. 【ICLR 2023】Diffusion Models扩散模型和Prompt Learning提示学习:prompt-to-prompt

    Diffusion Models专栏文章汇总:入门与实战 前言:今年prompt learning提示学习和diffusion models扩散模型实在是太火了,最新的ICLR 2023的一项工作把两 ...

最新文章

  1. PTA 7-3 旅游规划 (25分)(双权值Dijkstra最短路)
  2. 中国博士生提出最先进AI训练优化器,收敛快精度高,网友亲测:Adam可以退休了...
  3. 自学python方法-十二种学习Python的方法【Programming】
  4. qtmessagebox对话框里自定义按钮文本_Word里表格都是这么来的 — 生成绘制表格有技巧...
  5. 关节点和重连通分量,trajan算法实现(python)
  6. Flutter之window系统下配置开发环境以及在Android Studio里面运行hello word
  7. 为什么在2012/2013年我将在新的Enterprise Java项目中继续使用Spring *和* Java EE
  8. 网络对抗技术作业一 201421410031
  9. 微信小程序简单入门1
  10. 使用Memory DC
  11. python找数字程序_程序以查找Python中从1到N的所有缺失数字
  12. MISRA C编程规范标准
  13. 网络安全等级保护细则
  14. 样本量对差异性分析(Anova)或者T 检验的影响
  15. python-Matplotlib数据可视化
  16. 平面与空间射影几何小结——平面射影几何
  17. OpenCVSharp 相机棋盘格校正
  18. OpenStack 应答文件简单翻译
  19. 教你如何使用Ceph块设备增强OpenStack云环境
  20. 玩转小程序下篇--履带式行走

热门文章

  1. 惠普笔记本计算机无法启,hp手提电脑无法启动
  2. 为什么要学习HTML
  3. 【Flink】Flink kerberos 认证报错 while accessing user/group information via Hadoop utils
  4. 达人合作加持品牌布局,3.8女神玩转流量策略!
  5. linux有桌面有的没桌面_Linux桌面如何成长
  6. 按照指定起始和截止时间分割视频
  7. 基于java的数字签名技术在电子政务中的应用
  8. 《笨办法学》 学习笔记一
  9. 职场聚焦,现在年轻人的成功标准是什么?
  10. 2017年1月微软MVP申请开始了!