今天推荐一个黑科技开源项目,只需要你 5 秒钟的声音对话,就能克隆出你的声音,而且能够实时的生成你任意语音。

是不是很顶?

我觉个例子,如果我这里有 300 条你说话的语音,我把你的语音数据用这个开源项目去训练,训练完成后,我就可以使用这个训练好的模型生成任何你说的语音了。

你会听到一个声音和你一模一样的人说你没说过的话,那种感觉真的细思极恐。

这个黑科技就是:Real-Time-Voice-Cloning,现在已经开源,GitHub 24K 的 Star,最重要的是,这个项目提供了 GUI 界面,交互傻瓜式操作,语音采集、训练、生成都可以交互完成,很方便。

地址:https://github.com/CorentinJ/Real-Time-Voice-Cloning

环境配置

首先你需要 Python 3.6 的环境、安装 PyTorch(要求版本 > = 1.0.1)。Pytorch 是深度学习框架,你可以通过这个站点来安装这个库。

https://pytorch.org/get-started/locally/

紧接着需要安装 ffmpeg:

地址 https://ffmpeg.org/download.html#get-packages。除此之外,你还需要安装其他的依赖包。将项目下载下来,在包含 requirements.tx 目录下运行命令 pip install -r requirements.txt 就行了。

下载预训练的模型

把开源作者训练好的模型下载下来,我们不用自己训练,直接拿来用就行了:https://github.com/CorentinJ/Real-Time-Voice-Cloning/wiki/Pretrained-models,

下载完毕要放到如下的文件夹里面。

encoder\saved_models\pretrained.pt
synthesizer\saved_models\pretrained\pretrained.pt
vocoder\saved_models\pretrained\pretrained.pt
Details about model training and audio samples can be found here: https://blue-fish.github.io/experiments/RTVC-7.html

启动

当你配完了环境,就可以尝试使用这个黑科技了。运行命令 python demo_toolbox.py 就能启动这个黑科技啦!

下面是比较详细的使用教程,遇到问题可以查看帮助:

https://www.bilibili.com/video/av79481223?zw

https://blog.csdn.net/weixin_41010198/article/details/113186232

最后结尾说一下,我用这个模型试了一下,因为这个模型是老外开源的,所以训练的数据是英语的语音,我试了一下说中文,简直就是不会说中文的老外讲中文一个味道,现在我怀疑世界的真实性了。

开源地址:https://github.com/CorentinJ/Real-Time-Voice-Cloning

这个 GitHub 项目能克隆你的声音相关推荐

  1. Github项目(克隆,上传)简单git命令流程使用记录

    github是一个基于git的代码托管平台,付费用户可以建私人仓库,我们一般的免费用户只能使用公共仓库,将本地代码上传,也就是代码要公开.同时,我们也可以使用其强大的git命令去clone ,fork ...

  2. Git Clone克隆GitHub项目

    Git Clone克隆GitHub项目 对于GitHub项目下载,可以通过进入别人的主页 .如果要下载该项目的代码,可以进入代码项目,点击Code-->直接点击Download ZIP,这样解压 ...

  3. CNN架构复现实战 | 附视频和github项目

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 经常会看到类似的广告<面试算法岗,你被要求复现论文了吗?&g ...

  4. 有趣的Github项目万里挑一 !(附论文、项目链接)

    来源:PaperWeekly 本文共1000字,建议阅读5分钟. 本文为你介绍9个最新机器学习开源项目. 本文带你快速 get 每个精选Github项目的亮点和痛点,时刻紧跟 AI 前沿成果. 01 ...

  5. 搜索github项目stars排名

    搜索github项目stars排名 文章目录: 一.介绍 二.使用实例 1.996.ICU 2.搜索我想要某方向的优质项目 一.介绍 有时我们会想搜索一些比较好的项目,虽然stars多的不一定是非常好 ...

  6. python模仿声音_5秒钟让python克隆别人的声音

    AI越来越强大,不仅能模仿别人的表情,还能模仿别人说话的声音和语气,以后电话听到好友的声音也有可能不是本人哦,今天小编来讲讲一个实时声音克隆库Real-Time-Voice-Cloning githu ...

  7. Git配置安装使用教程操作github上传克隆数据

    Git是何方神圣? Git是用C语言开发的分布版本控制系统.版本控制系统可以保留一个文件集合的历史记录,并能回滚文件集合到另一个状态(历史记录状态).另一个状态可以是不同的文件,也可以是不同的文件内容 ...

  8. 给github项目贡献代码详细步骤

    本文以 dlink 项目为例. 1. fork 第一步是打开 github 上的项目地址,然后点击页面右上角的 fork 按钮,将项目 fork 到自己账号的仓库,记得登录自己的 github 账号. ...

  9. 使用码云加速下载github项目

    使用码云加速下载github项目 觉得有用的话,欢迎一起讨论相互学习~ 从codesheep中学到的思路,点关注不迷路,一键三联哦 众所周知,github上的项目下载都很慢,并且随着项目中文件数量变多 ...

最新文章

  1. 综述:PyTorch显存机制分析
  2. ExtJS grid简单应用之 展示JSON数据
  3. 用户名登陆的两种格式
  4. Android6.0的SMS(短信)源码分析--短信接收
  5. FreeCAD v0.19源码编译与VS2017+Qt5环境搭建
  6. linux c之c语言符合标准的头文件和linux常用头文件
  7. ALV可输入状态下输入金额字段变小数的问题
  8. 求圈地的方块数java,java实现第三届蓝桥杯方块填数
  9. php w 框架叫什么意思,框架是什么,为啥要用框架. 框架解决了什么
  10. hdu 4288 Coder (成都赛区 线段树)
  11. 【FPGA入门一】一个简单的LED流水灯
  12. WDM驱动程序的基本结构和实例
  13. vim插件管理器:Vundle的介绍及安装
  14. 人类最美的24张数学画(图)
  15. 智能制造与大数据平台
  16. 任正非:华为要做追上特斯拉的大乌龟
  17. 学好算法,真的需要智商吗?
  18. Mac苹果移动硬盘数据丢失怎么恢复?
  19. direction和unicode-bidi
  20. 华为云位居IDC中国大数据平台市场研究报告第一

热门文章

  1. aspire鹦鹉螺_【电子烟教程】aspire鹦鹉螺雾化器使用技巧 - 从入门到精通玩转电子烟...
  2. 【Java高级】枚举类与注解
  3. 【Java】HashMap线程安全问题
  4. 如何操作CAD高版本变为低版本
  5. 纯CSS实现3D立方体相册效果
  6. EXCEL 中如何实现两个表格之间的数据自动匹配
  7. 实时天气降水、气温、风力图作为Windows动态壁纸
  8. 短视频动画制作如何实现?这几个技巧告诉你 | 万彩动画大师
  9. php做宿舍门禁管理系统项目首选公司,一种校园宿舍门禁管理系统的制作方法
  10. [No00000B]MS OFFICE 2013 快捷键大全