本文经O’Reilly授权发布

大数据文摘字幕组作品

翻译:菜菜Tom、阿达、晓莉

监制:龙牧雪

在很多人的印象中,AI冰冷、生硬,和艺术无缘。但谷歌偏偏就不信。

谷歌大脑(Google Brain)有个Magenta项目,专门研究用TensorFlow和生成式模型来创造艺术作品,包括音乐、绘画作品等。他们的目的不是取代艺术家,而是为艺术家提供某些自动化协助,比如,编曲家可以用机器智能生成一段和弦。

项目代码已开源,请复制以下链接获取:

https://github.com/tensorflow/magenta

感觉有点酷!让我们来看看Magenta项目负责人Douglas Eck是怎样介绍他们的成果的。

视频来自O’Reilly和Intel AI Conference

时长15分钟,带有中文字幕▼

https://v.qq.com/x/page/m0611w3nbv9.html

内含一段AI演奏的肖邦钢琴练习曲

不要错过欣赏机会 ?

Magenta最近更新的博客文章里,详细介绍了MusicVAE音乐生成的相关技术细节。

博文链接:

https://magenta.tensorflow.org/music-vae

最重要的是对潜在空间(Latent Space)的利用,即将高维数据转换成低维。

如果将一段音乐表示为时序数据,那么一定是高维的。比如,就单音钢琴来说,在任何时候,都可以按下或松开88个键中的一个。我们可以将其表示为90种类型的事件(88次按键,1次松开,1次休息)。

如果我们忽略速度并用一个16分音符作为时间单位,则两个4/4排的小节将具有9032种可能的序列(旋律)。如果扩展到16个小节,将会是90256个可能的序列,它比宇宙中的原子数量多很多倍!

可视化来看的话,就是下面这样。这里是两小节随机的音符。纵轴代表钢琴上的音符,横轴代表时间。

但在潜在空间中,这些音符的表示是下面这样:

潜在空间能够表示低维空间中真实数据的变化。这意味着也可以通过潜在空间高精度地重建真实的数据。一种常见的模型是自动编码器(Auto Encoder)。

要生成一段音乐,需要模型学习较长的时间序列中的结构。在这里用到了一种分层解码器。

效果是,可以将一段旋律A和另一段旋律B相结合,生成一段“平均旋律”:

也可以用来给乐曲选择配器。

对艺术创作者来说比较有价值的,是基于这些成果开发的一些小工具,比如下面这个工具,可以自动生成一些旋律,供编曲人员使用:

这个项目组内还诞生了一些有趣的交互作品,比如被写进“不能错过的2017年AI圈大事”的SketchRNN。(文章链接:https://mp.weixin.qq.com/s/yyQXCVF5oExhpi9u1yNE_Q)

上面这张图说的是,基于谷歌开发的一个小游戏“QuickDraw”,研究人员收集了一批简笔画的数据,并用它们训练了一个模型,可以输出简笔画的图案。

有趣之处在于,人类的输入通常是脑洞大开的。

比如看上面的图片,左侧从上往下数第三组图案,人类输入了一只有5根胡须的猫。但是,机器认为一只“正常”的猫应该有6根胡须,左右各有3根,所以在输出图案的时候,就给这只猫多加了一根胡须。

同理,右上角的“8腿猪”显然也是超现实的,于是机器给我们画了一只正常的,2只眼睛4条腿的猪。

右侧第二组,人类给一个“猪”模型画了一辆卡车。以为机器会懵逼?没有。机器输出了一辆“猪猪卡车?”,或者说是,“卡车形猪猪?”?

至于右下角输入牙刷那位,实在是爱莫能助了。不过还是能看出来机器给牙刷加的猫耳朵和胡子。

SketchRNN介绍页面:

https://magenta.tensorflow.org/sketch-rnn-demo

你可以通过这个页面看其他人画过的一些样本,也可以点击Try Demo自己玩玩。首先你需要选择一个模型,模型加载完毕后,你就可以开始你的表演了,AI会根据你的笔画输出一个相应的图案。

文摘菌粗略看了一下,有100多个模型可以选择,什么蝴蝶、火烈鸟、手之类的都能画。随机试了一个“菠萝”模型,效果是这样的:

黑色的线条是文摘菌画的,绿色的线条是AI帮忙补全的。

生成简笔画和简单的和弦,AI能实现的这些功能对于艺术家来说还比较基础,但是在文摘菌看来还是挺神奇的!你觉得呢?

正如Doug在演讲视频中所言,“我可画不出这么好的猪猪卡车!”

AI不仅能画画,还能编和弦了:谷歌这几年取得了哪些艺术成就?相关推荐

  1. 视频|AI不仅能画画,还能编和弦了:谷歌这几年取得了哪些艺术成就?

    特别感谢大数据文摘字幕组翻译及后期制作 翻译:菜菜Tom.阿达.晓莉 监制:龙牧雪 在很多人的印象中,AI冰冷.生硬,和艺术无缘.但谷歌偏偏就不信. 谷歌大脑(Google Brain)有个Magen ...

  2. 为什么AI的翻译水平还远不能和人类相比?

    作者 | SHARON ZHOU 译者 | 王天宇 编辑 | 2812 出品 | AI 科技大本营 [导读]前一段时间,大家都在热议 Google 的翻译系统出现了一些相当奇怪的结果,例如下图呈现的是 ...

  3. AI取代人类作战还为时尚早

    未来战争中的人机融合隐患仍未解决 AI取代人类作战还为时尚早 近日,美国国家安全委员会联合主席埃里克·施密特发表文章,寻求应对人工智能挑战.保护国家安全.确保美国在人工智能领域全球领先地位的方法,并提 ...

  4. 索尼推出全能音乐AI工具:作曲混音编曲都OK!留给人类发挥的空间不多了

    博雯 发自 凹非寺 量子位 报道 | 公众号 QbitAI 在AI们还在某个特定领域学画画.学写歌的时候,索尼已经喊了一群AI来给音乐人做全能助手了! 包含从鼓点.贝斯.钢琴伴奏的生成,到多音轨的混合 ...

  5. 观点PK_倘若做不好AI,云服务商还能勇往直前吗?

    AI强大却不独立存在,如今已经成为人们普遍接受的理念之一. 在这个火热的时代,AI技术不是一个独立的产品,而是一种"基本生产力",它适用于大部分经济活动,可以让各行各业都产生&qu ...

  6. AI一分钟 | 都还没普及,智能音箱就开始急匆匆推广告了;全球路况最差的莫斯科,倒成了无人驾驶的绝佳训练场

    一分钟AI 中关村人工智能科技园落户门头沟,园区建成后将实现入驻企业约400家,年产值约500亿元. 中国弹药工厂引入机器人 港媒:生产能力提高两倍 乐视公司控股子公司新乐视智家电子科技 (天津) 有 ...

  7. 澎思科技马原:AI安防竞争还未结束,落地进入后发优势时代

    2019-12-15 11:42:18 鱼羊 整理自 MEET2020智能未来大会 量子位 报道 | 公众号 QbitAI 安防,是AI最先触达的领域之一.激烈竞争之后,看似"战争结束&qu ...

  8. AI大神Yann LeCun谈近期AI发展:最聪明的AI在常识方面还不如猫

    来源:网易智能 摘要:从虚拟助手到巨大的商业效益,人工智能正在重塑信息时代,作为著名的人工智能先驱者之一,Yann LeCun又是怎么看待这一领域的发展.近期的变化和潜力的呢? 从虚拟助手到巨大的商业 ...

  9. 澎思科技马原:AI安防竞争还未结束,落地进入后发优势时代 | MEET2020

    鱼羊 整理自 MEET2020智能未来大会 量子位 报道 | 公众号 QbitAI 安防,是AI最先触达的领域之一.激烈竞争之后,看似"战争结束",但亦有后发者,表现出了亮眼实力. ...

最新文章

  1. C#操作FTP报错,远程服务器返回错误:(550)文件不可用(例如,未找到文件,无法访问文件)的解决方法
  2. Intel汇编语言程序设计学习-第五章 过程-上
  3. 内存泄漏MobX State Tree_[译]iOS Crash Dump Analysis 错误的内存崩溃
  4. 【docker】修改docker容器配置,设置/修改端口映射
  5. html 页间传送数据,js 不同页面间传递值并取值,html不同页面间数据传递
  6. 【CF1194E】Count The Rectangles【类扫描线】【单调性】【树状数组】
  7. php导出excel数据代码,phpspreadsheet导出数据到Excel的方法介绍(代码示例)
  8. mysql+php+模板+条目_PHP.MVC的模板标签系统(四)
  9. Java UDP和TCP的区别
  10. linux命令怎么查看文件时间排序,linux中ls命令按照文件大小排...-ls命令按大小与时间排序文件...-ls按时间排序输出文件列表的实例分析_169IT.COM...
  11. 小朋友的经典造句,现在做老师的太不容易了
  12. 走近汇编理解与内核编程
  13. 单片机c语言fft函数,单片机ADC采样FFT计算试验
  14. Windows RDP远程桌面优化
  15. 快捷指令快速保存无水印视频和图集
  16. linux unbuntu
  17. SQLServer共享锁,更新锁,排它锁,死锁,默认隔离级别
  18. Ubuntu下编译VeraCrypt
  19. 微信小程序-时间轴/抽屉展开收起特效
  20. postfix 邮箱设置及常见错误

热门文章

  1. 8G+128G固态,新款笔记本,吃鸡贼爽!
  2. CentOS_7虚拟机搭建L2TP和PPTP服务器
  3. 计算机认不到鼠标键盘,电脑有时不认键盘和鼠标,求高手解决本人刚刚买的电脑,才一个多月 爱问知识人...
  4. ScrollView小拓展
  5. 关于ActivityThread
  6. fiddler网络换算
  7. 蓝凌专属钉钉智能OA 让数千万中小企业成长更高效
  8. springboot+vue+elementui外卖点餐系统骑手,商家
  9. 【2021最新版】MongoDB面试题总结(95道题含答案解析)
  10. 60、爱吃香蕉的珂珂