033_SS_Inversion-Based Creativity Transfer with Diffusion Models
下载地址:Arxiv 2022.11.23
Code地址:https://github.com/zyxElsa/creativity-transfer
1. Introduction
Motivations
- 以前的任意示例引导的艺术图像生成方法(比如风格迁移)通常无法控制形状变化或传达语义元素。而预训练的text-to-image diffusion需要大量的文字描述才能准确描绘特定绘画的属性。
- 本文的核心思想是从一幅画中学习艺术创造力,然后在不提供复杂的文字描述的情况下指导生成过程。
Arguments
- Style Transfer不能传递对象形状和语义元素等特定的创意属性。如图中的b,e
- Text-guided Stylization从自然图像和文本提示中生成艺术图像,但是通常目标风格的文本提示只能是对材料的粗略描述。如图中a,d
- Diffusion模型虽然可以生成高质量的结果,但是除了输入图像之外,如果我们想要再现一些生动的内容和风格,还需要详细的辅助文本输入来指导生成过程,这可能仍然难以在结果中再现特定绘画的创意
Contributions
- 本文提出了一种新任务:艺术创造力迁移的任务(Creativity Transfer)。给定一个单一的绘画图像,目标是通过使用自然图像或文本描述来控制内容,生成对其创作属性具有高保真度的新艺术图像。
- 本文提出了一种基于注意力的单图像文本反转方法,可以快速准确地学习图像的整体语义和艺术技巧,从而捕捉绘画的完整创意。
- 通过实验证明本文提出的创造性学习方法可以实现SOTA的性能和新颖的视觉效果
2. Methodology
主要思想是通过Textual Inversion将输入的艺术图像进行处理,得到其对应的包含了creativity的文本v,然后将v进行embedding后作为预训练好的Diffusion的条件输入。
2.1 Textual Inversion
做法是对于输入的条件图像y,利用CLIP image Encoder τ θ ( y ) \tau_{\theta}(y) τθ(y) 得到其对应的embedding,然后经过Attention后输出的v作为Diffusion要用的文本条件,经过Text encoder编码之后作为Diffusion的条件输入。
训练的目标则是Diffusion的目标
而在训练的时候, τ θ \tau_{\theta} τθ 和 ϵ θ \epsilon_{\theta} ϵθ 的参数是固定的。
2.2 Stochastic Inversion
本文指出,LDM生成图像的整体性由文本条件控制,而细节则有加入的噪声控制,因此本文固定了随机种子。
这个部分原文写的不太清楚,事实上本文我只给了两个S的一个重要原因就是文章好几个地方写的很不清楚,包括整体的训练和采样过程也没有详细给出。实验部分也是只有效果图,没有指标的比较。
3. Experiments
033_SS_Inversion-Based Creativity Transfer with Diffusion Models相关推荐
- 2022年11月100篇 diffusion models 扩散模型 汇总!
在生成图像方面,自从NIPS 2014的一篇开山之作: Generative Adversarial Nets 论文:https://proceedings.neurips.cc/paper/2014 ...
- 井喷式爆发!2022年11月100篇 diffusion models 扩散模型 汇总!
点击上方"摸鱼吧算法工程师"卡片,关注星标 获取有趣.好玩的前沿干货! 001 (2022-11-30) Maximum Likelihood Estimation for a ...
- Diffusion Models和GANs结合
Diffusion Models专栏文章汇总:入门与实战 前言:作为Diffusion Models最成功的前辈们:flow based models.VAEs.GANs,最近几个月已经有不少将dif ...
- Diffusion Models专栏文章汇总:入门与实战
最新最全Diffusion Models论文.代码汇总 1.Diffusion Models扩散模型与深度学习(数学原理和代码解读) 这篇文章适合小白入门看,能快速了解diffusion models ...
- 论文笔记High-Resolution Image Synthesis with Latent Diffusion Models
论文提出了latent diffusion models (LDMs).基于该模型最著名的工作是文本生成图像模型stable-diffusion. 普通的扩散模型在像素空间操作,运算复杂度较高.为了保 ...
- 生成模型(四):扩散模型(Diffusion Models)
本文大纲如下: 生成模型种类 到目前为止,我已经写了三种类型的生成模型,[[生成模型-GAN]].[[生成模型-VAE]]和[[生成模型-Flow based model]]. 它们在生成高质量样本方 ...
- [论文解析] Cones: Concept Neurons in Diffusion Models for Customized Generation
论文连接:https://readpaper.com/pdf-annotate/note?pdfId=4731757617890738177¬eId=171536153627444352 ...
- 详细解读Latent Diffusion Models:原理和代码
Diffusion Models专栏文章汇总:入门与实战 前言:CVPR 2022中的一项新工作latent diffusion models引起了广泛关注,提出了两段式diffusion model ...
- 【ICLR 2023】Diffusion Models扩散模型和Prompt Learning提示学习:prompt-to-prompt
Diffusion Models专栏文章汇总:入门与实战 前言:今年prompt learning提示学习和diffusion models扩散模型实在是太火了,最新的ICLR 2023的一项工作把两 ...
最新文章
- PTA 7-3 旅游规划 (25分)(双权值Dijkstra最短路)
- 中国博士生提出最先进AI训练优化器,收敛快精度高,网友亲测:Adam可以退休了...
- 自学python方法-十二种学习Python的方法【Programming】
- qtmessagebox对话框里自定义按钮文本_Word里表格都是这么来的 — 生成绘制表格有技巧...
- 关节点和重连通分量,trajan算法实现(python)
- Flutter之window系统下配置开发环境以及在Android Studio里面运行hello word
- 为什么在2012/2013年我将在新的Enterprise Java项目中继续使用Spring *和* Java EE
- 网络对抗技术作业一 201421410031
- 微信小程序简单入门1
- 使用Memory DC
- python找数字程序_程序以查找Python中从1到N的所有缺失数字
- MISRA C编程规范标准
- 网络安全等级保护细则
- 样本量对差异性分析(Anova)或者T 检验的影响
- python-Matplotlib数据可视化
- 平面与空间射影几何小结——平面射影几何
- OpenCVSharp 相机棋盘格校正
- OpenStack 应答文件简单翻译
- 教你如何使用Ceph块设备增强OpenStack云环境
- 玩转小程序下篇--履带式行走