语音合成

简介

HI,您好,欢迎使用腾讯AI开放平台语音合成API接口服务。

本文档主要针对需要集成HTTP API的技术研发工程师,详细描述语音合成能力相关的技术内容。

如果您对文档内容有任何疑问,可以通过以下几种方式联系我们:

官方交流一群:581197347

官方交流二群:705874401

官方交流三群:415349651

联系邮箱:aicamp@tencent.com

接口能力

接口名称

接口描述

API地址

语音合成(AI Lab)

将文字转换为语音,返回文字的语音数据。

https://api.ai.qq.com/fcgi-bin/aai/aai_tts

语音合成(优图)

将文字转换为语音,返回文字的语音数据。

https://api.ai.qq.com/fcgi-bin/aai/aai_tta

更多更强大的接口能力正在开发中,并逐步开放,敬请期待!

协议须知

调用方集成语音合成API时,请遵循以下规则。

规则

描述

传输方式

HTTPS

请求方法

GET

字符编码

统一采用UTF-8编码

响应格式

统一采用JSON格式

接口鉴权

签名机制,详情请阅接口鉴权

一、语音合成(AI Lab)

1. 接口描述

将文字转换为语音,返回文字的语音数据。

2. 请求参数

参数名称

是否必选

数据类型

数据约束

示例数据

描述

app_id

int

正整数

1000001

应用标识(AppId)

time_stamp

int

正整数

1493468759

请求时间戳(秒级)

nonce_str

string

非空且长度上限32字节

fa577ce340859f9fe

随机字符串

sign

string

非空且长度固定32字节

签名信息,详见接口鉴权

speaker

int

正整数

1

语音发音人编码,定义见下文描述

format

int

正整数

2

合成语音格式编码,定义见下文描述

volume

int

[-10, 10]

0

合成语音音量,取值范围[-10, 10],如-10表示音量相对默认值小10dB,0表示默认音量,10表示音量相对默认值大10dB

speed

int

[50, 200]

100

合成语音语速,默认100

text

string

UTF-8编码,非空且长度上限150字节

腾讯,你好!

待合成文本

aht

int

[-24, 24]

0

合成语音降低/升高半音个数,即改变音高,默认0

apc

int

[0, 100]

58

控制频谱翘曲的程度,改变说话人的音色,默认58

语音发音人编码

发音人

编码

普通话男声

1

静琪女声

5

欢馨女声

6

碧萱女声

7

合成语音格式编码

格式名称

编码

PCM

1

WAV

2

MP3

3

3. 响应参数

参数名称

是否必选

数据类型

描述

ret

int

返回码; 0表示成功,非0表示出错时错误码

msg

string

返回信息;ret非0时表示出错时错误原因

data

object

返回数据;ret为0时有意义

+ format

int

API请求中的格式编码

+ speech

string

合成语音的base64编码数据

+ md5sum

string

合成语音的md5摘要(base64编码之前)

4. 请求限制

单用户单接口的QPS(每秒请求次数)上限如下,如需更多请联系QQ客服反馈。

未认证用户

个人认证用户

企业认证用户

1

2

10

5. 参考示例

假设示例请求数据如下。

参数名称

参数数据

描述

app_id

1000001

仅供参考

speaker

1

仅供参考

format

2

仅供参考

volume

0

仅供参考

speed

100

仅供参考

text

腾讯,你好!

使用UTF-8编码

aht

0

仅供参考

apc

58

仅供参考

time_stamp

实时计算

nonce_str

实时计算

sign

实时计算

假设应用密钥为:a95eceb1ac8c24ee28b70f7dbba912bf。

下面使用PHP实现该HTTP API调用,其中getReqSign、doHttpPost可以从接口鉴权获取。

// 设置请求数据

$appkey = 'a95eceb1ac8c24ee28b70f7dbba912bf';

$params = array(

'app_id' => '1000001',

'speaker' => '1',

'format' => '2',

'volume' => '0',

'speed' => '100',

'text' => '腾讯,你好',

'aht' => '0',

'apc' => '58',

'time_stamp' => strval(time()),

'nonce_str' => strval(rand()),

'sign' => '',

);

$params['sign'] = getReqSign($params, $appkey);

// 执行API调用

$url = 'https://api.ai.qq.com/fcgi-bin/aai/aai_tts';

$response = doHttpPost($url, $params);

echo $response;

上述echo $response的输出结果即API的响应结果(注意使用UTF-8编码):

{

"ret": 0,

"msg": "ok",

"data": {

"format": 2,

"speech": "UklGRk...",

"md5sum": "5D92C5870E5DD36D4D56C0110B8F1E78"

}

}

二、语音合成(优图)

1. 接口描述

将文字转换为语音,返回文字的语音数据。

2. 请求参数

参数名称

是否必选

数据类型

数据约束

示例数据

描述

app_id

int

正整数

1000001

应用标识(AppId)

time_stamp

int

正整数

1493468759

请求时间戳(秒级)

nonce_str

string

非空且长度上限32字节

fa577ce340859f9fe

随机字符串

sign

string

非空且长度固定32字节

签名信息,详见接口鉴权

text

string

utf8格式,最大300字节

...

待合成语音文本

model_type

int

[0,2]

...

发音模型,默认为0,定义见下文描述

speed

int

[-2,2]

...

语速,默认为0,定义见下文描述

模型编码

模型

编码

女生

0

女生纯英文

1

男生

2

语速编码

语速

编码

0.6倍速

-2

0.8倍速

-1

正常速度

0

1.2倍速

1

1.5倍速

2

3. 响应参数

参数名称

是否必选

数据类型

描述

ret

int

返回码; 0表示成功,非0表示出错

msg

string

返回信息;ret非0时表示出错时错误原因

data

object

返回数据;ret为0时有意义

+ voice

string

合成语音的base64编码数据,语音为MP3格式

4. 参考示例

假设示例请求数据如下。

参数名称

参数数据

描述

app_id

1000001

仅供参考

text

腾讯,你好!

使用UTF-8编码

model_type

0

仅供参考

speed

0

仅供参考

time_stamp

实时计算

nonce_str

实时计算

sign

实时计算

假设应用密钥为:a95eceb1ac8c24ee28b70f7dbba912bf。

下面使用PHP实现该HTTP API调用,其中getReqSign、doHttpPost可以从接口鉴权获取。

// 设置请求数据

$appkey = 'a95eceb1ac8c24ee28b70f7dbba912bf';

$params = array(

'app_id' => '1000001',

'text' => '腾讯,你好',

'model_type' => '0',

'speed' => '0',

'time_stamp' => strval(time()),

'nonce_str' => strval(rand()),

'sign' => '',

);

$params['sign'] = getReqSign($params, $appkey);

// 执行API调用

$url = 'https://api.ai.qq.com/fcgi-bin/aai/aai_tta';

$response = doHttpPost($url, $params);

echo $response;

上述echo $response的输出结果即API的响应结果(注意使用UTF-8编码):

{

"ret": 0,

"msg": "ok",

"data": {

"voice": "UklGRk...",

}

}

c qq接口开发语言,文档中心相关推荐

  1. 项目视频讲解_深入浅出Lucene4.X实战开发大型企业文档中心管理系统

    深入浅出Lucene4.X实战开发大型企业文档中心管理系统 视频教程:http://pan.baidu.com/s/1CcuVM

  2. .net oss存储 oss api接口开发 office文档上传在线预览oss存储 office文档上传oss 阿里云oss接口开发

    word在线预览api接口 office在线预览接口 word转图片 ppt在线预览 excel在线预览 预览支持的文件格式:word(doc,docx),excel(xls,xlsx),ppt(pp ...

  3. 大型软件工程开发监理文档要求

    大型软件工程开发监理文档要求 "以信息化带动工业化,实现社会生产力的跨越式发展"是我国经济发展的重大举措,″十五″期间,信 息产业改造传统产业的市场规模大约是5000亿元.但由于建 ...

  4. 前端开发规范文档(html,css,js)

    首先吐槽一句,本来想上传word文档的,可是发现博客不能上传word文档,这就很尴尬了. 首先声明该规范不是本人写的,网上搜前端规范发现这个很详细就先复制下来做笔记,当然不可能啥都按规范来,每个公司的 ...

  5. 【编程规范】 后端API接口设计编写与文档编写参考

    文章目录 0 统一规范 0.1 理清业务流程 0.2 定义前后端开发的接口规范 0.3 定义接口文档 1 后端接口编写 1.0 后端接口介绍 1.0.1 接口交互 1.0.2 返回格式 1.0.3 C ...

  6. 支付宝接口程序、文档及解读(ASP.NET)

    支付宝接口程序.文档及解读(ASP.NET) 最近需要为网站加入支付宝的充值接口,而目前关于支付宝接口开发的资料比较杂乱,这里就我此次开发所用到的资料进行汇总整理,希望能够帮助需要的朋友. 开发步骤: ...

  7. 支付宝接口程序、文档及解读

    很早之前的一篇文章 ,记录下来 ,以备不时之需 最近需要为网站加入支付宝的充值接口,而目前关于支付宝接口开发的资料比较杂乱,这里就我此次开发所用到的资料进行汇总整理,希望能够帮助需要的朋友. 开发步骤 ...

  8. ML302-OpenCpu开发-资料文档(一)

    资料文档 为什么选择中移ML302? ML302能干什么? 从何下手? 资料文档以及SDK 硬件开发板 推荐博客 为什么选择中移ML302? 中移4G模组是中国最棒4G模组之一(老板开盘买下10万片模 ...

  9. 《gathertool开发使用文档》

    <gathertool开发使用文档> Date : 2023-03-28 Author : ManGe Mail : 2912882908@qq.com Github : https:// ...

最新文章

  1. l3fwd 是什么_服务器DPDK l3fwd性能测试
  2. 复现经典:《统计学习方法》第 9 章 EM 算法及其推广
  3. metadata usage in the runtime
  4. shell 提取sql 的字段名表名_SQL代码风格规范
  5. eclipse中的插件安装(svn、maven、jetty等)
  6. android 录音命令,音频延迟  |  Android NDK  |  Android Developers
  7. 没有工作经验找it_没有工作经验怎么找工作?
  8. Windows系统(cmd)常用命令
  9. mysql 传输表空间_Oracle传输表空间总结
  10. Reading HTML content from a UIWebView
  11. 类似%-30的字串解码办法
  12. 找企业网站源码学习研究
  13. 自学Java day24 一篇文章弄懂mySQL基础命令 从jvav到架构师
  14. 【二分图匹配】矩阵游戏
  15. 微软账号登录后本地账号就关联了且没有改用本地账号登录如何解决?
  16. 好有作为的Java 程序员,年薪40W其实并不高。
  17. subplots用法详解
  18. maven 打包 程序包org.project.entity不存在
  19. 埃尔米特多项式 (Hermite Polynomials)简介(1)
  20. lisp语言cond和if套用_lisp语言入门

热门文章

  1. Unity 设置分辨率(3600*1920)
  2. 【python基础】——python 复数运算
  3. 第五章 TensorFlow工具库(下)
  4. 张文成的《墨菲定律》读后感(二)
  5. Java中jar包怎么使用_java中jar包的使用方法
  6. 3GPP是干什么的?详解3GPP组织的历史,通信行业必读!
  7. 多个联盟广告调用代码,这样做可以做到打开页面,随机显示一个联盟广告代码
  8. 基站天线效率相关技术研究
  9. [python] 机器学习 随机森林算法RandomForestRegressor
  10. 玩 Lin UI 搞小程序之:用步骤条组件做个时间简史