视学算法报道  

编辑:拉燕

【新智元导读】DALL-E 2又整活了!20秒内生成Cosmopolitan杂志封面,设计团队不到一小时直接下班了。

DALL-E 2又一次出现在了我们的眼前。

自打自媒体兴起了以后,传统的纸媒就日渐式微了。无论是报纸还是杂志,看的人都越来越少。人们纷纷转向了手机自媒体,以此获取最新的资讯和信息。

然而,最近国外的一个团队用人工智能模型DALL-E 2首次生成了一本杂志的封面。

效果好像...还不错。

传统纸媒和前端科技的结合,到底能迸发出什么样的火花?

思考20秒,光速出图

该团队由Cosmopolitan杂志的几名编辑,人工智能实验室OpenAI的几名专家,还有一名数字艺术家Karen X. Cheng组成。

就是这几个人,有一天聚到了一起,打算用人工智能做个杂志封面出来。

当然了,杂志封面说到底也是图片,而AI生成图片可不是什么新鲜事。

自打上个世纪50年代,到今天70来年的时间里,很多人都尝试过用AI来生成图片。

其实就在上周,经济学人还用AI机器人生成了一张图片,插到了一篇讲AI的文章里,然后顺手又拿这张照片当了封面插图。

而这次Cosmopolitan杂志,则更是把这件事做到了极致。

一开始,Cheng给模型输入了一些指令,要求生成上个世纪60年代的时尚女性的特写,要那种百科全书式的插图。

然后AI琢磨了20秒,就生成了如下这一组高质量的图片。

上图中,每一个女性的形象都是独一无二的。而且可以肯定地说,在AI搞出这些图片之前,这些图片压根不存在。纯纯是AI刚捏的。

而这就是最近活跃的不行的DALL-E 2。它能收集用户的需求,然后调动自己的「知识储备」,浏览人类历史中上亿张已有的图片,最终一张生成独一无二的图像。

甚至,每一个像素都是新的不能再新的。

是不是还不错?DALL-E 2自从4月限量发布以来,一直就饱受好评,人们被这个小模型的能力折服,看过的都说好。

The Verge甚至表示,DALL-E 2能掀起一场以创造力为主题的革命。

团队成员没一会儿就散会了。短短的不到一个小时的时间里,封面就这么敲定了。

从这么一张小小的封面背后,研究人员看到了更深层次的问题。即,AI和艺术的关系,和伦理的关系,以及,和我们未来的关系。

当然,上面6个女人的图片只是一个测试,最终的封面是一张航天员在月球表面探索的图片。

而如果仔细看看AI究竟是怎么生成的过程,你会觉得不可思议的。

不是真的艺术家

说回DALL-E。他的创造者其实不希望人们将这个模型过度拟人化,他们认为,如果承认AI是一个自主的实体会让人们招架不住。

看看之前谷歌LaMDA的新闻就知道了。

其实,DALL-E从根本上讲,还是在模仿人类。该模型由神经网络支持,而主要的算法就是模仿人脑工作。

它通过分析图像以及人们输入的文字,来「了解」对象,以及这些对象之间的关联。

DALL-E的产品经理Joanne Jang举了这么个例子:如果DALL-E看到了很多考拉的照片,而这些照片的标题就是考拉,那么这个模型就会知道考拉长什么样子。

而如果输入的是考拉骑摩托车,那么DALL-E就会结合它自己对考拉、摩托车,以及骑行的概念来对这三者之间的关系进行解释。

但其实,DALL-E还并没有达到最完美的地步。OpenAI表示,现在该模型还处于预览阶段。工程师会持续对其进行调整,并慢慢向用户开放。现在,DALL-E每周仅向1000名用户发布。

它的问题目前主要有两方面。第一是,虽说它渲染的大部分图像质量都很高,但是往往更精细的细节部分不那么尽如人意。要不就模糊,要不生成的东西就太抽象。

特别要指出的事是,DALL-E渲染人脸方面不太行。它会故意生成歪七扭八的眼部,或是扭曲的嘴唇。其实这是为了防止生成的图片用于造假,或是用作色情图片使用。

另一个问题是,DALL-E 2进行学习的模型其实是含有偏见的。最基本的,生成出来的图片基本都是白人。这显然是因为数据集里的人类白人巨多。

当然了,不管怎么说,专家们普遍认为。虽然DALL-E取代视觉艺术家这个说法,目前来看还是无稽之谈,但这项技术能创造新的机会,甚至全新的艺术形式应该是板上钉钉的了。

来自英国的独立AI艺术策展人Luba Elliott表示,她希望DALL-E能将更多的女性带入艺术领域。

我们还是应该持观望态度。不应该太过畏手畏脚,也不应该太过于激进。

总之,谨慎谨慎再谨慎。

参考资料:

https://www.cosmopolitan.com/lifestyle/a40314356/dall-e-2-artificial-intelligence-cover/

https://www.economist.com/news/2022/06/11/how-a-computer-designed-this-weeks-cover

点个在看 paper不断!

DALL-E 2再跑酷!杂志封面20秒内搞定,设计师都傻了相关推荐

  1. GPT-3组合DALL·E,60秒内搞定游戏设定和原型动画!网友看后:这游戏想玩

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 明敏 发自 凹非寺 量子位 | 公众号 QbitAI 如果不说,你能 ...

  2. pg 百万数据表 添加序号 20秒轻松搞定

    创建新表,利用row_number函数将序号查询出来和所有字段作为查询结果添加到新表中. 1.序号查询利用row_number函数 ROW_NUMBER() OVER (ORDER BY a.字段 A ...

  3. 网络在20秒内没有下行RTP数据包,被叫终端主动中断VoLTE通话链路

    问题描述 被测终端在预定测试地点进行"语音数据业务并发的eSRVCC"测试时 终端A进行FTP上传和下载,数据业务在测试过程中一直保持: 终端A语音呼叫终端B,测试20次: 1次出 ...

  4. 阿里动物园再添新丁,小蛮驴搞定物流最后三公里

    作者 | 硬核云顶宫 责编 | 李雪敬 头图 | CSDN 下载自视觉中国 今天的云栖大会上,阿里动物园再添新丁,不再这个新加入的动物既不是骡子也不是马,而是小蛮驴,这是一个专门解决物流最后三公里的A ...

  5. 空间皮肤代码_不废话,看我20行代码搞定色块提取与定位…….

    点击上方蓝字关注我们 微信公众号:OpenCV学堂 关注获取更多计算机视觉与深度学习知识 问题来由 这个问题是谁问我的我已经不记得了,刚开始的时候他发了这张图像给我,让我给他看一下,我当时告诉他转换一 ...

  6. 阿里动物园再添新丁,小蛮驴搞定物流最后三公里!

    作者 | 硬核云顶宫 责编 | 李雪敬 头图 | CSDN 下载自视觉中国 CSDN编者按:昨天的云栖大会上,阿里动物园再添新丁,不再这个新加入的动物既不是骡子也不是马,而是小蛮驴,这是一个专门解决物 ...

  7. 【如何20秒内进入XP系统】

    如果你的电脑开机时间长让你等到不耐烦的话,或许是有多种原因的,想改善自己电脑的开机时间,可以先找出导致开机时间慢的原因再一一去解决它. 一.影响启动速度的硬件因素 笔者通过实践,发现影响电脑 认证系统 ...

  8. 利用python+seleniumUI自动化登录获取cookie后再去测试接口,今天终于搞定了

    #coding=utf-8 from selenium import webdriver from selenium.common.exceptions import NoSuchElementExc ...

  9. 自己做站点(二) 20块钱搞定一个企业站:域名amp;空间申请

    域名注冊的话,推荐大家用新网,由于申请费用确实非常低,但续费的价格还是比較高的,所以不妨多申请几年.打开站点: http://www.xinnet.com/ 注冊一个帐号,然后申请域名,你能够看到,费 ...

最新文章

  1. oracle flashback table 参数,Oracle10g中FLASHBACK TABLE语句恢复DML误操作
  2. 实测:xml与json速度约差4倍
  3. Java并发:volatile内存可见性和指令重排
  4. DataWorks搬站方案:Airflow作业迁移至DataWorks
  5. Python小游戏(打乒乓)
  6. 基于神经网络的混合计算(DNC)-Hybrid computing using a NN with dynamic external memory
  7. python打开快捷方式_Python打开一个JAR快捷方式
  8. mysql 开发基础系列19 触发器
  9. winform上传文件解决方案
  10. 当identity_insert 设置为off时不能为表_最近新get日志测试方法,再也不用为故障响应慢发愁!...
  11. 小程序ColorUI使用简易教程
  12. 密码学基础之对称密钥的分发和存储
  13. java 最大素数,JAVA计算指定上限的最大素数
  14. 统计学基础12-秩和检验
  15. 台式计算机如何上无线网络,台式机如何无线上网
  16. SpringBoot 获取 Yml 配置 信息 Environment
  17. 免费图床-树洞外链-阿离图床
  18. SICP习题2.6 题目理解
  19. Android程序员该如何进阶?,2021Android面经
  20. 应用集成——数据库集成与简单实现IoC容器

热门文章

  1. python中的类属性、实例属性、类方法、实例方法
  2. Python中setattr()、getattr()、hasattr() 函数
  3. 懒汉式与饿汉式的区别
  4. Ubuntu22.04+Nvidia RTX 3060 显卡驱动安装
  5. 选购音响需了解的技术指标(二)
  6. springboot+网建短信通发送短信
  7. mysql截取点前面两位的字符串,Mysql字符串截取函数SUBSTRING的用法说明
  8. Android audio播放策略和设备的获取
  9. 【JAVA进阶】java中的集合(番外篇3)- HashMap源码底层数据结构分析
  10. 前所未有的安全感----华为云解决方案为网站安全保驾护航