微软语音技术 Windows 语音编程初步
一、SAPI简介
软件中的语音技术包括两方面的内容,一个是语音识别(speech recognition) 和语音合成(speech synthesis)。这两个技术都需要语音引擎的支持。微软推出的应用编程接口API,虽然现在不是业界标准,但是应用比较广泛。
SAPI全称 The Microsoft Speech API.相关的SR和SS引擎位于Speech SDK开发包中。这个语音引擎支持多种语言的识别和朗读,包括英文、中文、日文等。
SAPI包括以下组件对象(接口):
(1)Voice Commands API。对应用程序进行控制,一般用于语音识别系统中。识别某个命令后,会调用相关接口是应用程序完成对应的功能。如果程序想实现语音控制,必须使用此组对象。
(2)Voice Dictation API。听写输入,即语音识别接口。
(3)Voice Text API。完成从文字到语音的转换,即语音合成。
(4)Voice Telephone API。语音识别和语音合成综合运用到电话系统之上,利用此接口可以建立一个电话应答系统,甚至可以通过电话控制计算机。
(5)Audio Objects API。封装了计算机发音系统。
SAPI是架构在COM基础上的,微软还提供了ActiveX控件,所以不仅可用于一般的windows程序,还可以用于网页、VBA甚至EXCEL的图表中。如果对COM感到陌生,还可以使用微软的C++ WRAPPERS,它用C++类封装了语
微软语音技术 Windows 语音编程初步相关推荐
- 语音识别 微软语音技术SAPI语音编程初步
一.SAPI简介 软件中的语音技术包括两方面的内容,一个是语音识别(speech recognition) 和语音合成(speech synthesis).这两个技术都需要语音引擎的支持.微软推出的应 ...
- Windows网络编程初步
1. OSI/RM和TCP/IP 国际标准化组织(ISO)和国际电报电话咨询委员会(CCITT)制定OSI/RM OSI/RM:Open SystemInterconnect/Recommended ...
- 微软云技术Windows Azure专题(一):如何利用Service Bus向Windows商店应用推送消息
本文介绍了如何使用Windows Azure的Service Bus通知中心发送推送通知Windows商店应用程序. 先来明确一下大体上要做哪些步骤: 1.申请一个Windows应用商店的应用.(每个 ...
- 什么是语音技术及其应用?语音识别的研究意义与进展
你知道小冰吗?你呼叫过小度吗?你和小娜互动过吗?你使用过Siri吗?如果都没有,那你就out了.它们都是当下很火爆的智能语音机器人,很多人都和它们聊过天. 日前,美国投资机构Mangrove Capi ...
- 刚刚拿下「中国AI最高奖」的语音技术,能给我们带来什么?
金磊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 什么样的语音项目,能拿"中国AI最高奖"? 不久前,中国唯一国家级的人工智能科技奖--吴文俊人工智能科学技术奖,公布了最 ...
- [转]Windows 语音编程初步
[转]Windows 语音编程初步 一.SAPI简介 软件中的语音技术包括两方面的内容,一个是语音识别(speech recognition) 和语音合成(speech synthesis).这两个技 ...
- 黄学东出任微软全球人工智能首席技术官,从负责语音技术到微软Azure云的转身
导语:根据最新任命,黄学东将领导新统一的 AI 认知服务工程和研究团队. 日前,微软首位华人"全球技术院士".微软首席语音科学家黄学东出任微软全球人工智能首席技术官,全面负责微软A ...
- 一文看懂语音技术商业化逻辑:对品牌意味着什么 | 综述
▼ 点击上方蓝字 关注网易智能 聚焦AI,读懂下一个大时代! 引言 基于语音的技术将对许多行业产生巨大影响,在短短两年内,预计50%的搜索将基于语音技术. 该项技术的普及率可能因用户的年龄.地理位置和 ...
- 人工智能语音技术支持“多情感程度”调节,细腻演绎“人声”
近期,微软发布最新语音技术,支持"情感程度"轻松调节,令智能语音的情感表现力更加细腻可控. 人类的情感很大程度上体现于语音语调的微妙变化,比如一句"再见",有时 ...
最新文章
- 【2015 Week Task】
- 实验问题总结与分享之DNS(Domain Name Server)
- c语言中point的用法_关于C语言Switch语句,先学这些技巧够不够?
- WCF和ASP.NET Web API在应用上的选择
- boost::math::tools::sum_series用法的测试程序
- 客户端突如其来的“白屏”等待该如何解决?
- jQuery_2_常规选择器-进阶选择器
- 国立大学 计算机,新加坡国立大学 计算机
- 使用混合多云每个人都应避免的3个陷阱(第4部分)
- Android Proguard Questions
- flash player for linux 64,64-bit linux下装什么adobe flash player
- php对象在内存中的分配
- Linux下显示IP地理位置信息的小工具—nali(很强大)
- 解决小程序view之间默认的空隙
- linux终端串口调试(RS232 serial ttyS)
- 原来普洱茶还有预防头痛,减轻体重,缓解压力和失眠的作用,而且是年份久的普洱茶效果好
- C++的字符串输入方式
- Android 签名方法---同时使用V1和V2签名
- 行列式求值Java语言实现———线性代数
- 【微信群助手机器人】好不好用?可以实现哪些功能?