会议:2021 interspeech
作者:Yinghao Aaron Li
单位:Columbia University

文章目录

  • abstract
  • introduction
  • method
  • experiments
    • dataset

abstract

  • StarGAN v2做many-to-many的变声,使用20个英文说话人训练,可以完成any-to-many,cross-lingual, singing voice conversion。
  • 使用style-encoder,可以把plain speech转换成stylistic speech。

introduction

变声的技术路线可以分为三类:

  • Auto-encoder approach:encoder去编码说话人无关的信息,需要设定各种限制移除说话人相关的信息;
  • GAN-based:使用判别器判断生成的语音和真实目标人的相似度,因为不能保证判别器从real data中学到了合理的信息,因此转换生成的语音可能会有相似度不高、发音错误等问题;
  • TTS-based:利用文本标签,保证了音色一致度,但是不能适用于没有文本的场景。

本文是基于StarGAN的框架,对比自然度和相似度结果超过了AUTO-VC 和VTN (tts-based)

method

使用StarGAN v2一样的结构,加入 joint detection and classification (JDC) F0 extraction network保证基频一致性;

目标函数

  • 对抗损失
  • asr loss
  • 基频一致性
  • 风格区分性 LdsL_{ds}Lds​,随机挑选两个风格,区分度越大越好

experiments

dataset

  • VCTK20人的数据,for style JVS dataset(10人,有正常的和假音的句子);for emotion emotional speech dataset (ESD),

StarGANv2-VC相关推荐

  1. VC串口通信编程-2

    VC串口通信编程 (2009-07-08 13:48:40) 转载▼ Win32串口编程(转:韩耀旭) 在工业控制中,工控机(一般都基于Windows平台)经常需要与智能仪表通过串口进行通信.串口通信 ...

  2. VC中基于 Windows 的精确定时

    方式一:VC中的WM_TIMER消息映射能进行简单的时间控制.首先调用函数SetTimer()设置定时 间隔,如SetTimer(0,200,NULL)即为设置200ms的时间间隔.然后在应用程序中增 ...

  3. VC manifest

    manifest原理和用途 dll是被动态调用的,所以会被若干个程序共享使用的 但是如果dll在应用程序不知道的情况下升级了.或是被另一个程序更改了,就可能会出现问题,即"DLL Hell& ...

  4. VC运行时库(/MD、/MT等)

    VC项目属性→配置属性→C/C++→代码生成→运行时库 可以采用的方式有:多线程(/MT).多线程调试(/MTd).多线程DLL(/MD).多线程调试DLL(/MDd).单线程(/ML).单线程调试( ...

  5. vc picture控件载入背景图,随控件大小改变

    在mfc里,想要在Picture控件中载入一张图片有两种方法:静态的和动态的.静态的方法就是图片先载入资源(.rc)文件中,拥有一个唯一的ID:动态的方法就是制定图片的路径名即可. 当然这样的方法网上 ...

  6. VC开发Windows客户端软件之旅——前言

    从第一次拖着行李入京找活,至今已工作若干年了.这些年一直追逐自己的梦想,跑过三个城市,换了三份工作,认识了很多业内的朋友.和朋友们闲聊时,发现很多人都已经不再做客户端软件了.有的转去做管理,有的转去做 ...

  7. WMI技术介绍和应用——使用VC编写一个半同步查询WMI服务的类

    在<WMI技术介绍和应用--VC开发WMI应用的基本步骤>文中,我们介绍了VC使用WMI技术的基本框架.本节我将讲解封装和实现一个用于半同步查询WMI的类.(转载请指明出于breaksof ...

  8. WMI技术介绍和应用——VC开发WMI应用的基本步骤

    在<WMI技术介绍和应用--WMI概述>中介绍了我们可以使用C++..net或者支持ActiveX技术的脚本语言来使用WMI.但是各种语言对WMI的控制能力是不同的,比如脚本语言只能用来从 ...

  9. VC下通过进程ID获取进程镜像文件路径的方法及其存在的缺陷

    工作中经常会遇到通过进程ID获取进程镜像文件或者其他模块的路径的需求.(转载请指明出处)网上关于方案大致存在两种方案: OpenProcess->GetModuleFileName OpenPr ...

  10. VC提前注入.net软件的方法

    在之前几节介绍了各种注入方法,但是这些方法存在一些缺陷--对.net程序注入无效.(转载请指明出处) 这个可以理解,.net程序的代码不是汇编,而是微软自定义的IL中间语言..net CLR如同虚拟机 ...

最新文章

  1. python 栈排序
  2. linux进程VSZ(虚拟内存)
  3. WebService入门教程_HTTP协议学习
  4. Python 数据分析与展示笔记3 -- Matplotlib 库基础
  5. 【微信小程序】数组操作
  6. putty的基本使用
  7. 在类内定义成员函数、在类外定义成员函数、计算长方体的体积【C++面向对象编程类的使用经典案例】
  8. 机器学习初探:Logistic选股模型实证
  9. 高淇python讲义百度文库_Python课堂笔记(高淇400集第一季).pdf
  10. 计算机系统具有运行可靠性,计算机系统的可靠性技术
  11. 如何制作一寸。二寸。六寸照片 多学点,以后自己也可以弄哦
  12. 王二是如何看到李四的《艳娘传奇》的,快来了解一下ROS2的话题机制吧!
  13. 特征值和奇异值(svd)
  14. 熬夜读书最好吃什么东西补充能量类``
  15. GUCCI、LV等奢侈品巨头如何布局元宇宙的,其他品牌应该跟上吗?
  16. [HTML5]配置Ngnix服务器支持manifest
  17. 一些值得细细品味的书籍
  18. js面向对象编程基础
  19. Python利用微软Azure免费的语音合成TTS源码分享
  20. 深圳大学计算机考研难吗,深圳大学(专业学位)计算机技术考研难吗

热门文章

  1. 思维方式才是你职业瓶颈期的根本原因
  2. 题解 P1120 【小木棍 [数据加强版]】
  3. 基于flask徐州市天气信息可视化分析系统【纯干货分享,附源码04600】
  4. 时间之外-沉睡者 - 2022/2/24
  5. 谷歌 AI 中国中心总裁李佳辞职创业?实锤来了
  6. 【第3版emWin教程】第49章 emWin6.x的AppWizard创建控件回调消息
  7. DataTable数据批量写入数据库三种方法比较
  8. 不调用C++/C字符串库函数,实现字符串复制函数strcpy
  9. Java开发人员不得不收集的代码
  10. 将毫秒转换为分钟和秒