lyrebird 一分钟模仿你的声音

假如有一天,你发现机器人发出跟你完全一样的声音,你是该欢喜,还是惊慌?这并不是危言耸听,谷歌的一家实验室已经开发出一项新技术,能够在1分钟模仿任何声音,把声音合成技术提高到一个崭新的高度,但同时,技术的双刃剑效应也应该引起人们的警惕。

琴鸟


很巧的是,这家公司的名字也是一种叫做琴鸟的鸟类名字。琴鸟的神奇之处在于,它不仅能模仿多种其他鸟类的声音,它还能模仿大自然不存在的声音,比如说汽车鸣笛声、伐木用的电锯声、相机的快门声。

声音合成,只需1分钟

琴鸟的模仿者,lyrebird公司在众多声音合成公司中脱颖而出。它宣称,只需要1分钟的声音样本,就可以模仿任何人说话。直接拖拽到编辑区域直接展示;

之所以能产生如此高还原度的合成声音,背后的技术正是神经网络(Neural Network)和机器学习(Machine Learning)。神经网络模拟电信号在人脑神经元之间的传递过程,对输入数据进行处理。它利用分层的神经元,从大量样本数据中总结出共同特征。目前,神经网络在图片识别、字幕生成等方面受到了广泛应用。

在这里,研究人员首先用很多不同的声音训练神经网络,把声音的音节数据还原成声音。Lyrebird公司的创始人亚历山大·布雷比松(Alexandre de Brébisson)说:“不同的声音中包含了很多信息。”神经网络能够从声音样本中抓取关键特征,如音色、音调、音节、停顿等等,而这些关键特征足够定义一个人的声音,这跟人们根据声音判断说话者是一个道理。布雷比松把这些关键特征比作声音的DNA,“在学习了很多不同讲话者的声音后,学习一个全新的陌生声音就会快很多,这也是我们为什么不用那么多数据的原因。更多的数据肯定也是有帮助的,不过一分钟就足够捕捉声音的DNA中的大部分信息了。”

半秒合成1千句话

除了表现出出色的模仿效果,Lyrebird公司的声音合成技术还能在快速合成声音。公司官网上宣称,借助系统的GPU群,它可以在半秒钟内合成1千句话。它的合成原理简单来说就是,记录某人1分钟的声音,lyrebird把声音中的DNA压缩成特殊的钥匙,随后用这个钥匙就可以合成任何与说话者相似的声音。


然而这项技术的漏洞也是显而易见,不在于技术本身,而在于使用它的人。如果这项技术被图谋不轨的人利用,社会上的误导、迷惑、欺骗行为可能会更加猖獗。小到钱财,大到人身安全、社会集体利益可能都会受到威胁,无意间的犯罪或者被侵犯都是非常可怕的事情。

关于技术的道德问题,Lyrebird在其官网也专门给出了解释,他们声明开发的技术实在警醒人类在未来(甚至现在)声音篡改模仿都是可能的,尽管现在法庭上还将录音作为一项重要的证据,他们不认为这是很妥当的,因为谁都可能伪造这种证据。而通过将这项技术发布给全世界,他们希望确保技术的安全性,希望人人都能接触到这个信息:在不久的将来声音也可以被破解。

lyrebird 一分钟模仿你的声音相关推荐

  1. 浙大学霸本科生顶会研究!只需20分钟音频,AI就能逼真模仿你的声音

    铜灵 发自 凹非寺 量子位 出品 | 公众号 QbitAI AI精准模仿你的声音,需要多大规模的训练? 浙江大学和微软的新研究证明,从0开始学习你的声音到准确逼真,AI只需要200个音频片段和相应标注 ...

  2. 仿生女朋友会梦见电子男朋友吗?——能模仿女神说话声音的闲聊QQ机器人

    摘要 我做了个能模仿女神说话声音的闲聊QQ机器人. (她语音回答的是:没呢,我为什么要吃?) 详细 QQ机器人框架 我当前能找到的,且可以使用的框架只有小栗子机器人. 小栗子机器人官方并不提供Pyth ...

  3. ai模仿声音软件_利用人工智能技术模仿CEO的声音进行了诈骗

    (文章来源:教育新闻网) "我们应该对人工智能非常小心--借助人工智能,我们正在召唤恶魔."-麻省理工学院AeroAstro百年纪念研讨会的埃隆·马斯克(Elon Musk). 随 ...

  4. Github 标赞8.7k !Mocking Bird,五秒模仿你的声音,支持中文!

    ‍‍转自 | 新智元 来源 | GitHub 编辑 | LRS‍ ‍ 随着AI技术的发展,在模仿脸之后,模仿声音也不是难事.最近GitHub上一个超火的项目,可以快速模仿声音,最重要的是支持中文,目前 ...

  5. 只听几句话,百度AI就能模仿你的声音 | 附论文

    夏乙 编译整理 量子位 出品 | 公众号 QbitAI 只需要听你说几句话,AI就能"克隆"出你的声音. 这是百度Deep Voice项目最新get的能力. Deep Voice推 ...

  6. python声音模仿_Python与声音制造(2)

    Python 与声音制造 _ _ _ _ _ _ _ _ _ 罗丹不带乐队改教数学了. 惊不惊喜? 意不意外? 还不快逃? 1 -第一部分: 声音与数学- Topic 2: 认识傅里叶级数函数 如果你 ...

  7. AI 人工智能取代编剧?写剧本、模仿声音、制造笑点,机器学习进军好莱坞?!

    来源:Los Angeles Times 编译:李雷.宋欣仪 屡获殊荣的电影制作人Kevin Macdonald曾执导过许多部电影,包括<末代独裁>和<国家要案>等,而在去年, ...

  8. AI 人工智能取代编剧?写剧本、模仿声音、制造笑点,机器学习进军好莱坞?!...

    来源:Los Angeles Times 编译:李雷.宋欣仪 屡获殊荣的电影制作人Kevin Macdonald曾执导过许多部电影,包括<末代独裁>和<国家要案>等,而在去年, ...

  9. python模仿声音_5秒钟让python克隆别人的声音

    AI越来越强大,不仅能模仿别人的表情,还能模仿别人说话的声音和语气,以后电话听到好友的声音也有可能不是本人哦,今天小编来讲讲一个实时声音克隆库Real-Time-Voice-Cloning githu ...

最新文章

  1. Maven 的这 7 个问题你思考过没有?
  2. 31页官方PPT,回顾史上最大芯片WSE:科技的壮丽美感!
  3. python3官方说明文档_接下来? · Python3.7.3官方文档 简体中文 · 看云
  4. variables needed for gradient computation has been modified by an inplace operation
  5. MFC创建单文档工程(左上角名称前的mfc图标修改为其他需求图标)
  6. jzoj3086,luogu3831-[SHOI2012]回家的路【最短路,拆点】
  7. TreeTemplate树模板
  8. oracle打开当前表的编辑,oracle sqlplus常用命令
  9. java string返回_Java的String字符串内容总结
  10. Flutter State生命周期 Flutter Widget生命周期 Flutter 应用程序生命周期
  11. angularjs详解
  12. 模板模式与策略模式/template模式与strategy模式/行为型模式
  13. WebApp那些事——(JqueryMobile) 实战(一)
  14. 拓端tecdat|R语言网络社区检测(社群发现)分析女性参加社交活动和社区节点着色可视化
  15. 用servlet编写下载程序
  16. 通信upf是什么意思_管理UPF的方法、装置及系统与流程
  17. 3d打印路径规划 matlab,基于FDM技术的3D打印路径规划技术研究
  18. 计算机网络位置拒绝访问,Win10无法访问D盘提示位置不可用 拒绝访问的解法
  19. prometheus如何评估告警策略以及如何推送告警消息到alertmanager?
  20. 用大白菜装centos7_u盘安装centos 卡住大白菜怎么用u盘装win7系统

热门文章

  1. jzoj2248 送快递 (很鸡儿巧的题)
  2. 通过邮箱验证码找回密码
  3. FILE c语言的使用
  4. 标准DH建模与改进DH建模
  5. 一文搞懂socket读写数据接口API
  6. luat系统中的异或校验程序
  7. ffmpeg分离左右声道到多音轨
  8. hive 分区表select全部数据_Hive分区表的分区操作
  9. 我整理的CSS - lbx
  10. 照片误删了怎么恢复?照片删了回收站也删了怎么找回来