在AI语音交互全流程中,面对语音识别、语义分析、语音合成这三座大山,我们仍然需要不忘初心,砥砺前行,以期获得更为自然、富有情感的人机交互体验。

标贝科技是一家专注于人工智能数据服务的公司,一直以来秉承为客户提供专注、专业、高质的数据服务,其更致力于有着较高技术含量的语音合成领域的深耕与研究。标贝科技在语音合成领域,提供包括发音人选择、语料设计、语音采集、数据处理、语音深度加工等,数据类型上包括文本数据、语音数据等,服务包括TTS评测系统等,为客户提供一整套的定制化语音合成服务。

TTS即是“语音合成”又称“文语转换”(Text-To-Speech),指通过机械的、电子的方法生成语音的技术。当前TTS系统可分为前端和后端两部分。前端完成输入文本的归一化、分词、发音预测、韵律结构预测的处理;后端对声音建模,通过学习得到声音参数合成声音。由于自然语音本身的复杂性和开放性,前端处理部分难度大,需覆盖面广,导致该部分一直是语音合成领域的重点和难点。

目前成熟的语音合成技术分两种,第一种称为拼接法。把语音里面所有的语料基础片段都录好,再根据需要,利用技术手段择取语音单元,并拼接成具体话语,这种方法需要大量的语音录制。第二种称为参数法。基于有限的语料数据通过参数模型训练,合成新语段,参数法的优势在于对录音数量要求较少,几千句话就能出一个合成效果。无论用户用哪种合成技术,都离不开专业的语音数据服务,而标贝最核心的业务恰恰是提供优质的语音数据,让用户可以专心于合成技术的研发,快速实现高质量的合成系统。

在自然语言、语音合成领域,发展速度较快。但是我们在与智能设备进行互动时,回传到耳朵里的,仍然是满满“机械感”、缺少情感的声音。要解决这一问题,基础建设是关键。目前TTS评测系统测试阶段,为人工智能语音技术公司提供免费评测服务,欢迎业内人士提出宝贵建议,共同完善TTS评测系统。

标贝科技首发TTS评测系统,并针对语音合成系统提供了一整套的TTS前端解决方案。标贝科技的评测系统主要分为两大模块,即:合成缺陷度评测和合成自然度评测。其合成缺陷度主要体现为韵律、多音字、数字符号及分词词性四个模块。针对这四个模块的评测,即为TTS缺陷度评测。合成自然度评测则包括ABX和MOS评测。

韵律评测

韵律层级预测错误,直接影响句子的自然度及可懂度。此模块以涵盖10个领域的测试集对TTS前端系统进行韵律处理的评测,对处理结果进行对比分析,将TTS前端韵律处理的问题呈现给用户,通过正确率,反映问题所在。

多音字评测

多音字是影响句子可懂度的一个重要因素,此模块以涵盖100余个常用多音字的测试集对TTS前端系统进行多音字处理的评测,并对处理结果进行对比分析,让用户了解TTS前端多音字的问题所在。

数字符号评测

数字符号的类型多样,常以混合方式出现在各个领域的文字中。数字符号的预测错误对句子的理解及句意的表达会产生重大影响。此模块以涵盖多种类型的数字、符号及组合测试集对TTS前端系统的数字符号模块进行评测,呈现结果让用户有针对性的解决关键问题。

分词词性评测

分词词性的正确与否,会影响韵律及多音字的正确率。分词词性的预测错误,是导致韵律错误的主要因素之一,从而影响句子的自然度和可懂度。此模块的测试,可以帮助客户了解此模块的性能,从而得到进一步改进。

ABX&MOS评测

ABX和MOS的评测,即为TTS合成自然度的评测。以代表不同的TTS用户群体的评测人员,分别以横向和纵向两种不同的方式对TTS合成系统的自然度和流畅度进行评测。目的在于,让用户了解自身TTS系统的优化空间及市场竞争力。

综合评测

标贝科技针对用户的TTS语音,从TTS前端的文本预处理、文本分析、韵律层级预测到TTS音高、时长等声学参数,以及声码器等影响语音生成的因素进行分析,查找问题源头,提供合理建议及问题解决方案,从而提高合成效果。

标贝科技依靠对语音合成领域的经验所提供的TTS评测系统,解决语音合成的本质问题,让语音在人机交互的作用发挥上有了更多想象空间!

无障碍人机交互时代已向我们走来,标贝科技推出语音合成评测系统相关推荐

  1. 标贝科技| 靠“脸”能办事的领域越来越多,人脸识别将成智能时代标配

    [编者按] 人脸识别,已是人工智能浪潮中最火热的技术之一.目前,它正大规模走出实验室,走入各行各业,方便了生活.降低了成本.提高了效率,也因此逐渐成为人们日常生活中的"标配". 疑 ...

  2. BAT都在悄悄“拆”中台,“碎片化中台” 时代已来!

    01 潮水退去,中台逐渐回归技术本质 2015年阿里提出中台战略,构建符合DT时代的"大中台,小前台"的组织机制和业务机制,中台的序幕就此来开.时任阿里巴巴CEO的逍遥子不会想到, ...

  3. 机器人周志_唐骏:机器人时代已如梦初醒

    文 |著名职业经理人,微创中国董事长 唐骏 (本文刊发于<中国经济周刊>2016年第49期) 谷歌的人工智能机器人"阿尔法狗"(AlphaGo)在世界级围棋人机大战中战 ...

  4. 逆水寒紫禁之巅服务器维护,逆水寒紫禁之巅服务器或将成历史?王思聪、PDD时代已渐行渐远...

    原标题:逆水寒"紫禁之巅"服务器或将成历史?王思聪.PDD时代已渐行渐远 从没有一款端游,能像<逆水寒>这样,能吸引如此多的社会名流入驻游戏.在游戏开测之初,打着&qu ...

  5. 全民大数据时代已来 阿里数加平台详解

    文章讲的是全民大数据时代已来 阿里数加平台详解,业界流行一种说法,云计算与大数据就是一枚硬币的两面,相生相惜,不可分割.在当下互联网时代,数据的价值越来越受到社会的认可,并在今天,已然成为一种普惠资源 ...

  6. 流量时代已亡,如何在 ROI 的魔咒下生存?

    随着流量为王时代的凋零,让 ROI 长居考核 KPI 榜首,甚至是唯一 KPI,成为无数人的梦魇.也沦为市场营销.运营.产品等人员束手束脚的紧箍咒,他们被紧紧的扼住了资金的出口,却不断被逼加大产出,痛 ...

  7. 科技行业的起步时代已结束

    在理解科技行业的主导时,我们需要明白更新换代的驱动力是如何转变的. 作者 | Ben Thompson 译者 | 弯月,责编 | Elle 出品 | CSDN(ID:CSDNnews) 以下为译文: ...

  8. 罗永浩回应被叫行业冥灯:完全不能同意;联想一员工侵占公司工时费近1000万;爱彼迎CEO:办公室时代已过去 | EA周报...

    EA周报 2022年5月13日 每个星期7分钟,元宝带你喝一杯IT人的浓缩咖啡,了解天下事.掌握IT核心技术. 周报看点 1.联想一员工内外勾结,侵占公司工时费近1000万 2.钉钉被曝裁员30%,相 ...

  9. AIoT时代已来 创业者转型有道 长江商学院物联网行业创新创业沙龙圆满结束!

    2019年,中国步入改革开放40周年,已迈入智能制造业增长期,科技发展水平已开始由"追赶式发展"向"智能制造式发展"转变.科技增长速度虽快,然而企业在技术研发等 ...

最新文章

  1. Visual Web Development 2005开发ASP.NET使用小技巧
  2. sklearn——CountVectorizer详解
  3. clinical significance临床显著性
  4. Okhttp----缓存的加入方式----附完整demo
  5. 设计模式复习-模板方法模式
  6. 4.Java中的关键字和标识符
  7. 【随感】i'm new here
  8. 实验8 SQL Server 的存储过程
  9. 【100题】第三十四 实现一个队列
  10. [vue] 你了解axios的原理吗?有看过它的源码吗?
  11. mysql使用了索引还是慢,`MySQL GROUP BY使用索引时速度较慢
  12. 智能电能计量管理系统
  13. mysql简易购物车系统_jsp+mysql实例简单的购物车
  14. maria安装包mysql_mariadb安装
  15. 计算机考在职研究生难不难,计算机在职硕士考试难吗?
  16. matlab如何泰勒公式用求近似值_泰勒公式在生活中的应用.doc
  17. 红黑联盟mysql,红黑联盟官网被人恶意留下后门
  18. CSS基础-09-布局(定位 position、浮动float,元素对其、图像对其、文本对齐、元素内内容对齐,元素堆叠)
  19. C语言实现人民币小写转大写
  20. Faiss(16):编译时添加对AVX512指令的支持

热门文章

  1. Mac系统快捷键一览
  2. BufferedCopy
  3. C# Stopwatch详解
  4. Spring Boot AOP 扫盲,实现接口访问的统一日志记录
  5. 阿克曼结构移动机器人的gazebo仿真(九)
  6. Unhandled Rejection (ChunkLoadError): Loading chunk mf-dep_vendors-node_modules_core-js_index_j
  7. 按字/字节编址与按字/字节访问的理解
  8. 命令行执行C语言程序时清屏命令
  9. android rtorrent 编译,rtorrent 文本方式的bt下载工具
  10. 现代物流计算机与英语,物流专业英语翻译与计算机基础-物流英语阅读.doc