特别感谢大数据文摘字幕组翻译及后期制作

翻译:菜菜Tom、阿达、晓莉

监制:龙牧雪


在很多人的印象中,AI冰冷、生硬,和艺术无缘。但谷歌偏偏就不信。


谷歌大脑(Google Brain)有个Magenta项目,专门研究用TensorFlow和生成式模型来创造艺术作品,包括音乐、绘画作品等。他们的目的不是取代艺术家,而是为艺术家提供某些自动化协助,比如,编曲家可以用机器智能生成一段和弦。


项目代码已开源,请复制以下链接获取:

https://github.com/tensorflow/magenta


感觉有点酷!让我们来看看Magenta项目负责人Douglas Eck是怎样介绍他们的成果的。



视频来自O'Reilly和Intel AI Conference

时长15分钟

带有中文字幕

class="video_iframe" data-vidtype="2" allowfullscreen="" frameborder="0" data-ratio="1.7647058823529411" data-w="480" scrolling="no" data-src="http://v.qq.com/iframe/player.html?vid=m0611w3nbv9&width=654&height=367.875&auto=0" style="display: block; width: 654px !important; height: 367.875px !important;" width="654" height="367.875" data-vh="367.875" data-vw="654" src="http://v.qq.com/iframe/player.html?vid=m0611w3nbv9&width=654&height=367.875&auto=0"/>

内含一段AI演奏的肖邦钢琴练习曲

不要错过欣赏机会 ?


Magenta最近更新的博客文章里,详细介绍了MusicVAE音乐生成的相关技术细节。


博文链接:

https://magenta.tensorflow.org/music-vae


最重要的是对潜在空间(Latent Space)的利用,即将高维数据转换成低维。


如果将一段音乐表示为时序数据,那么一定是高维的。比如,就单音钢琴来说,在任何时候,都可以按下或松开88个键中的一个。我们可以将其表示为90种类型的事件(88次按键,1次松开,1次休息)。


如果我们忽略速度并用一个16分音符作为时间单位,则两个4/4排的小节将具有9032种可能的序列(旋律)。如果扩展到16个小节,将会是90256个可能的序列,它比宇宙中的原子数量多很多倍!


可视化来看的话,就是下面这样。这里是两小节随机的音符。纵轴代表钢琴上的音符,横轴代表时间。



但在潜在空间中,这些音符的表示是下面这样:



潜在空间能够表示低维空间中真实数据的变化。这意味着也可以通过潜在空间高精度地重建真实的数据。一种常见的模型是自动编码器(Auto Encoder)。


要生成一段音乐,需要模型学习较长的时间序列中的结构。在这里用到了一种分层解码器。



效果是,可以将一段旋律A和另一段旋律B相结合,生成一段“平均旋律”:





也可以用来给乐曲选择配器。


下面请欣赏AI配乐?

听起来像是古典和摇滚乐的组合


对艺术创作者来说比较有价值的,是基于这些成果开发的一些小工具,比如下面这个工具,可以自动生成一些旋律,供编曲人员使用:



这个项目组内还诞生了一些有趣的交互作品,比如被写进“不能错过的2017年AI圈大事”的SketchRNN。



上面这张图说的是,基于谷歌开发的一个小游戏“QuickDraw”,研究人员收集了一批简笔画的数据,并用它们训练了一个模型,可以输出简笔画的图案。


有趣之处在于,人类的输入通常是脑洞大开的。


比如看上面的图片,左侧从上往下数第三组图案,人类输入了一只有5根胡须的猫。但是,机器认为一只“正常”的猫应该有6根胡须,左右各有3根,所以在输出图案的时候,就给这只猫多加了一根胡须。


同理,右上角的“8腿猪”显然也是超现实的,于是机器给我们画了一只正常的,2只眼睛4条腿的猪。


右侧第二组,人类给一个“猪”模型画了一辆卡车。以为机器会懵逼?没有。机器输出了一辆“猪猪卡车?”,或者说是,“卡车形猪猪?”?


至于右下角输入牙刷那位,实在是爱莫能助了。不过还是能看出来机器给牙刷加的猫耳朵和胡子。


SketchRNN介绍页面:

https://magenta.tensorflow.org/sketch-rnn-demo


你可以通过这个页面看其他人画过的一些样本,也可以点击Try Demo自己玩玩。首先你需要选择一个模型,模型加载完毕后,你就可以开始你的表演了,AI会根据你的笔画输出一个相应的图案。


文摘菌粗略看了一下,有100多个模型可以选择,什么蝴蝶、火烈鸟、手之类的都能画。随机试了一个“菠萝”模型,效果是这样的:



黑色的线条是文摘菌画的,绿色的线条是AI帮忙补全的。


生成简笔画和简单的和弦,AI能实现的这些功能对于艺术家来说还比较基础,但是在文摘菌看来还是挺神奇的!你觉得呢?



正如Doug在演讲视频中所言,“我可画不出这么好的猪猪卡车!”


还没看够?参加今年北京4月10-13号的O'Reilly和Intel AI Conference,跑步入场还不晚哦。(点击阅读原文,或拨打电话咨询:010-88097476)

视频|AI不仅能画画,还能编和弦了:谷歌这几年取得了哪些艺术成就?相关推荐

  1. AI不仅能画画,还能编和弦了:谷歌这几年取得了哪些艺术成就?

    本文经O'Reilly授权发布 大数据文摘字幕组作品 翻译:菜菜Tom.阿达.晓莉 监制:龙牧雪 在很多人的印象中,AI冰冷.生硬,和艺术无缘.但谷歌偏偏就不信. 谷歌大脑(Google Brain) ...

  2. 新一代视频AI服务 —— 阿里云智能视觉重磅发布

    2019独角兽企业重金招聘Python工程师标准>>> 3月27日下午,第51期阿里云产品发布会-智能视觉产品隆重发布,本次产品发布会首次面向全网用户深入的解读了智能视觉的前世今生. ...

  3. 云端智创 | 基于视频AI原理的音视频智能处理技术

    本文内容整理自「智能媒体生产」系列课程第二讲:视频AI与智能生产制作,由阿里云智能视频云高级技术专家分享视频AI原理,AI辅助媒体生产,音视频智能化能力和底层原理,以及如何利用阿里云现有资源使用音视频 ...

  4. 阿里云视频AI全能力解读

    摘要: 结合人工智能视频理解流程和用户的需求场景,我们将视频AI的功能分成四个大部分,视频智能审核.视频内容理解.视频智能编辑.视频版权保护.其中视频审核功能包括视频鉴黄.暴恐涉政识别.广告二维码识别 ...

  5. 攻克视频AI界难题,直通芒果TV offer,这场算法大赛你一定不能错过

    一场面向顶尖 AI 技术人才的数据竞赛正广募英雄,获奖者不仅有奖金回报,还有机会直接进入芒果 TV 算法岗位面试.首届「马栏山杯」国际音视频算法大赛正在火热进行中. 在当前热门的人工智能领域,就业竞争 ...

  6. 査勇:华为云在视频AI转码领域的技术实践

    随着5G的落地和消费终端的不断升级,消费环节对视频画质的要求也越来越高,为了给消费者带来更清晰.更逼真和更具沉浸感的观感体验,对云端视频处理技术也提出了更高的要求.本次分享,华为云媒体处理服务研发负责 ...

  7. 阿里云智能视频 AI 重装来袭

    摘要: 近日,阿里云重磅推出视频点播新功能--视频AI ,基于深度学习.计算机视觉技术和海量数据,为广大用户提供多场景的视频AI服务. 点此查看原文:http://click.aliyun.com/m ...

  8. 视频AI,助力体育赛事转播走进智能时代

    摘要: 2018俄罗斯世界杯经过近20天的激战,已经进入到最关键的阶段.本次赛事除了精彩纷呈的比赛之外,还加入很多高科技的元素,例如门线.VAR技术等等.让本届世界杯成为科技含量最高的一届世界杯. 2 ...

  9. 视频AI对话杭州云栖:新一代视频智能生产的探索与实践

    在今年的杭州云栖大会AB区中庭,有一个全透明建筑备受瞩目,这就是云栖数据指挥中心.在这块大屏中的媒体中央厨房部分,正是采用了视频智能生产方案,将多模态内容理解与云导播和云剪辑相结合,使原来小时级别的视 ...

最新文章

  1. 帧中继-实验(第三篇)
  2. 网络攻击与防御技术第三次实验
  3. FileChannel
  4. 交换网络中的嗅探和ARP欺骗
  5. 画图调子图间距_好看好用的桥梁工程图,你值得拥有!
  6. Azure 静态 web 应用集成 Azure 函数 API
  7. 骆驼祥子大事件时间轴_骆驼中的事件处理
  8. php 面试靠快速排序,搞定PHP面试 - 常见排序算法及PHP实现
  9. UEditor 1.36 版本 jsp版上传图片自定义路劲配置
  10. hdu2191(多重背包)
  11. “Java引领技术人生”专题讲座——Java畅销书作者李刚巡讲活动
  12. 项目一 Part 4.2 基于网格搜索的超参数优化实战
  13. matlab中提取裂缝图像,灰度图像中裂缝自动识别和检测方法与流程
  14. 【常用模块】HC-05蓝牙串口通信模块使用详解(实例:手机蓝牙控制STM32单片机)
  15. centos7 aarch64 环境编译安装MP4Box
  16. [Python黑帽] 二.Python能做什么攻击?正则表达式、网络爬虫和套接字通信入门
  17. 动态图片怎么制作 html,怎么制作动态图片
  18. Linux偷偷“吃”了我的内存?
  19. 联盛德 HLK-W806 (十): 在 CDK IDE开发环境中使用WM-SDK-W806
  20. android 仿微信来电_仿MIUI、微信来电通知无法解决通知折叠到通知列表

热门文章

  1. 【Cocos Creator 实战】03 - 如何「拿起」拼图游戏的每块图片
  2. 美团点评 TiDB 深度实践之旅
  3. 使用Glimpse 监测ASP.NET MVC网站
  4. 阿里国际站新出的优选国家推广怎么样?我帮大家探探路
  5. CBOW和Skip-Gram模型介绍及Python编程实现
  6. SSM新冠疫情服务系统 计算机专业毕设源码49727
  7. vue h5项目架构搭建
  8. Cosmos互联链通信技术规范(上) 1
  9. 计算机系统变更注意事项,电脑文件夹图标更改步骤及注意事项【图文教程】
  10. 飞机订票管理系统(Java+数据库+MVC)