前言

最近在研究AV Foundation 框架 发现有一本书叫做
AV Foundation开发秘籍:实践掌握iOS & OS X 应用的视听处理技术
然后google查了一下英文版叫
Learning AV Foundation: A Hands-on Guide to Mastering the AV Foundation Framework
看着国人的翻译不仅慨叹的想说一句话: 为啥不自己写一本书 何必这么费劲翻译它搞得原来很有技术含量 这么直译就没技术含量了。看着开发秘籍这名字不禁想起大学时那些书 从开发到入门… 21天学会xxx… 开发指南… 开发秘籍… 我大学读的都是假书

今天给大家分享的是 iOS上如何 把汉字转换成语音朗读, 当然这个没什么技术含量(大神可以飞过).

AVFoundation整体架构

研究这个功能之前先介绍一下AV Foundation整体架构

这是iOS上的架构设计 (上图)

这是macOS上的架构设计(上图)

看完之后我们就来用代码实现这个demo
首先导入<AVFoundation/AVFoundation.h>

这我需要使用的是iOS上的AVSpeechSynthesizer,macOS上叫NSSpeechSynthesizer

@property (strong, nonatomic) AVSpeechSynthesizer *synthesizer;

AVSpeechSynthesizer 它的功能

  • 将文字添加到语音, 就是用语音播放一段文字

初始化

- (void)awakeFromNib {[super awakeFromNib];//创建语音合成器self.synthesizer = [[AVSpeechSynthesizer alloc] init];self.synthesizer.delegate = self;//播放的国家的语言self.voices = @[[AVSpeechSynthesisVoice voiceWithLanguage:@"zh-CN"],[AVSpeechSynthesisVoice voiceWithLanguage:@"en-US"]];self.speechStrings = [[NSMutableArray alloc] init];
}

这里的[AVSpeechSynthesisVoice voiceWithLanguage:@"zh-CN"]
设置的是简体中文语音 文章末尾会列出所有语音播放信息不用担心写错.

AVSpeechSynthesizer的delegate方法如下 主要是对语音播放状态的监听

@protocol AVSpeechSynthesizerDelegate <NSObject>
// 代理方法
@optional
// 开始播放 语音单元
- (void)speechSynthesizer:(AVSpeechSynthesizer *)synthesizer didStartSpeechUtterance:(AVSpeechUtterance *)utterance;
// 完成播放 语音单元
- (void)speechSynthesizer:(AVSpeechSynthesizer *)synthesizer didFinishSpeechUtterance:(AVSpeechUtterance *)utterance;
// 暂停播放 语音单元
- (void)speechSynthesizer:(AVSpeechSynthesizer *)synthesizer didPauseSpeechUtterance:(AVSpeechUtterance *)utterance;
// 继续播放 语音单元
- (void)speechSynthesizer:(AVSpeechSynthesizer *)synthesizer didContinueSpeechUtterance:(AVSpeechUtterance *)utterance;
// 取消播放 语音单元
- (void)speechSynthesizer:(AVSpeechSynthesizer *)synthesizer didCancelSpeechUtterance:(AVSpeechUtterance *)utterance;
// 这里 指的是 又来监听 播放 字符范围
- (void)speechSynthesizer:(AVSpeechSynthesizer *)synthesizer willSpeakRangeOfSpeechString:(NSRange)characterRange utterance:(AVSpeechUtterance *)utterance;
@end

这里的AVSpeechSynthesizer主要的方法有

/* 添加 播放话语 到 播放语音 队列, 可以设置utterance的属性来控制播放 */
- (void)speakUtterance:(AVSpeechUtterance *)utterance;
// 对于 stopSpeakingAtBoundary: 语音单元的操作, 如果中断, 会清空队列
// 中断
- (BOOL)stopSpeakingAtBoundary:(AVSpeechBoundary)boundary;
// 暂停
- (BOOL)pauseSpeakingAtBoundary:(AVSpeechBoundary)boundary;
// 继续
- (BOOL)continueSpeaking;

这里我们用的speakUtterance方法来播放文字
speakUtterance:(AVSpeechUtterance *)utterance

  1. AVSpeechUtterance是对文字朗读的封装
  2. 被播放的语音文字, 可以理解为一段需要播放的文字
    这里我们设置AVSpeechUtterance朗读播放的信息

//播放语音
NSArray *speechStringsArray = [self buildSpeechStrings]; //buildSpeechStrings播放字符串的数组for (NSUInteger i = 0; i < speechStringsArray.count; i++) {//创建AVSpeechUtterance 对象 用于播放的语音文字AVSpeechUtterance *utterance = [[AVSpeechUtterance alloc] initWithString:speechStringsArray[i]];//设置使用哪一个国家的语言播放utterance.voice = self.voices[0];//本段文字播放时的 语速, 应介于AVSpeechUtteranceMinimumSpeechRate 和 AVSpeechUtteranceMaximumSpeechRate 之间utterance.rate = 0.5;//在播放特定语句时改变声音的声调, 一般取值介于0.5(底音调)~2.0(高音调)之间utterance.pitchMultiplier = 0.8f;//声音大小, 0.0 ~ 1.0 之间utterance.volume = 1.0f;//播放后的延迟, 就是本次文字播放完之后的停顿时间, 默认是0utterance.preUtteranceDelay = 0;//播放前的延迟, 就是本次文字播放前停顿的时间, 然后播放本段文字, 默认是0utterance.postUtteranceDelay = 0.1f;[self.synthesizer speakUtterance:utterance];}

AVSpeechUtterance的属性如下

// 设置使用哪一个国家的语言播放
@property(nonatomic, retain, nullable) AVSpeechSynthesisVoice *voice;
// 获取当前需要播放的文字, 只读属性
@property(nonatomic, readonly) NSString *speechString;
// 获取当前需要播放的文字 - 富文本, 只读属性, iOS10以后可用
@property(nonatomic, readonly) NSAttributedString *attributedSpeechString;
// 本段文字播放时的 语速, 应介于AVSpeechUtteranceMinimumSpeechRate 和 AVSpeechUtteranceMaximumSpeechRate 之间
@property(nonatomic) float rate;
// 在播放特定语句时改变声音的声调, 一般取值介于0.5(底音调)~2.0(高音调)之间
@property(nonatomic) float pitchMultiplier;
// 声音大小, 0.0 ~ 1.0 之间
@property(nonatomic) float volume;
// 播放后的延迟, 就是本次文字播放完之后的停顿时间, 默认是0
@property(nonatomic) NSTimeInterval preUtteranceDelay;
// 播放前的延迟, 就是本次文字播放前停顿的时间, 然后播放本段文字, 默认是0
@property(nonatomic) NSTimeInterval postUtteranceDelay;

AVSpeechUtterance的方法如下

以下全部都是初始化方法, 分为 类方法 和 对象方法, 富文本的初始化方法要在iOS10以后才可以用

+ (instancetype)speechUtteranceWithString:(NSString *)string;
+ (instancetype)speechUtteranceWithAttributedString:(NSAttributedString *)string NS_AVAILABLE_IOS(10_0);
- (instancetype)initWithString:(NSString *)string;
- (instancetype)initWithAttributedString:(NSAttributedString *)string

可以使用**[AVSpeechSynthesisVoice speechVoices]**代码打印出支持朗读语言的国家

ar-SA 沙特阿拉伯(阿拉伯文)
en-ZA, 南非(英文)
nl-BE, 比利时(荷兰文)
en-AU, 澳大利亚(英文)
th-TH, 泰国(泰文)
de-DE, 德国(德文)
en-US, 美国(英文)
pt-BR, 巴西(葡萄牙文)
pl-PL, 波兰(波兰文)
en-IE, 爱尔兰(英文)
el-GR, 希腊(希腊文)
id-ID, 印度尼西亚(印度尼西亚文)
sv-SE, 瑞典(瑞典文)
tr-TR, 土耳其(土耳其文)
pt-PT, 葡萄牙(葡萄牙文)
ja-JP, 日本(日文)
ko-KR, 南朝鲜(朝鲜文)
hu-HU, 匈牙利(匈牙利文)
cs-CZ, 捷克共和国(捷克文)
da-DK, 丹麦(丹麦文)
es-MX, 墨西哥(西班牙文)
fr-CA, 加拿大(法文)
nl-NL, 荷兰(荷兰文)
fi-FI, 芬兰(芬兰文)
es-ES, 西班牙(西班牙文)
it-IT, 意大利(意大利文)
he-IL, 以色列(希伯莱文,阿拉伯文)
no-NO, 挪威(挪威文)
ro-RO, 罗马尼亚(罗马尼亚文)
zh-HK, 香港(中文)
zh-TW, 台湾(中文)
sk-SK, 斯洛伐克(斯洛伐克文)
zh-CN, 中国(中文)
ru-RU, 俄罗斯(俄文)
en-GB, 英国(英文)
fr-FR, 法国(法文)
hi-IN 印度(印度文)

总结

为了学习**AVFoundation**我先从一个简单的知识点入手,唯一觉得遗憾的是我不太确定是否这个合成器支持自定义语音朗读;

最终的demo 支持iOS和macOS,如果需要Demo:加iOS高级技术交流群:624212887,获取Demo,以及更多iOS学习资料

参考:
AV Foundation Apple 官方文档
AVSpeechSynthesizer 和 AVSpeechUtterance
AVSpeechSynthesizer详解

文章来源于网络,如有侵权请联系小编删除

Learning AV Foundation(一)汉字语音朗读相关推荐

  1. Learning AV Foundation(三)AVAudioRecorder

    前言 在AV Foundation中使用AVAudioRecorder类添加音频录制功能和使用AVAudioPlayer一样简单, 都是在Audio Queue Server上层构建的.同时支持mac ...

  2. English Learning - L2-5 英音地道语音语调 弹力双元音 [ɪə] [ʊə] [eə] 2023.03.6 周一

    English Learning - L2-5 英音地道语音语调 弹力双元音 [ɪə] [ʊə] [eə] 2023.03.6 周一 朗读节奏 元音的长度 元音发音在清辅音和浊辅音前的区别 元音发音跟 ...

  3. 语音朗读中多音字问题

    语音朗读技术日益普及但多音字问题始终没有得到解决,虽然采用词组可以减少一些多音字识别的困难,但不能从根本上解决问题.在朗读中出现将字音读错实在使人不爽.所以大家都来集思广益,想出切实可行的解决方法,让 ...

  4. 免费实用的语音朗读软件:朗读女 5.0发布

    自从上次发布了新版本的朗读女有相当长的一段时间没有新版本了,今天作者给我们带来了全新的5.0版,那么有哪些重要的更新呢?5.0版相对于之前本版做了以下修改与更新: 增加当前被朗读文本高亮显示. 增加朗 ...

  5. 用python朗读字母-使用python编写一个语音朗读闹钟功能的示例代码

    想找一个可以播放文字的闹钟找不到,自己写一个更简单.TTS实现由很多种办法,百度等都提供了API接口,但类似百度,需要先注册等一系列动作. 其实windows自带的win32com功能可以简单实现TT ...

  6. 主攻ASP.NET.4.5.1 MVC5.0之重生:Web项目语音朗读网页文本,简单语音提示浏览状态

    第一步 添加SpeechLib.dll 下载SpeechLib.dll: 在项目中并且引用DLL using SpeechLib; using System.Threading; 第二步 调用并使用 ...

  7. C#语音朗读文本 — TTS的实现

    TTS, Text To Speech的缩写,是使用语音朗读文本的技术.目前,在国内应用较多的是排队叫号系统 Windows 平台的TTS,通常使用的是微软自带的 Speech API. Window ...

  8. 关于 java 实现 语音朗读

    最近有个java项目要实现 一个 java语音朗读的功能,百度了半天 没有现成的 .也是一头雾水.没具体思路.....大体上总结了下网上的资料  1.java 实现起来 比c或者vb 能麻烦点,或者是 ...

  9. php写语音朗读,详解在网页上通过JS实现文本的语音朗读

    摘要: 语音合成:也被称为文本转换技术(TTS),它是将计算机自己产生的.或外部输入的文字信息转变为可以听得懂的.流利的口语输出的技术. 1.接口定义 http://tts.baidu.com/tex ...

最新文章

  1. Android selector 使用注意.
  2. 进程间通信的几种方式
  3. 2月书讯:终究还是来了
  4. 后台开发经典书籍--Zookeeper分布式过程
  5. 计算机考研我该如何准备,计算机考研该如何准备呢-考研初试
  6. 第一天:制定项目章程
  7. js中判断值不等于undefined
  8. 一个超强的逆向分析软件
  9. Android Service被系统回收的解决方法
  10. np.random.uniform,random,choice,newaxis
  11. 修改 tomcat 初始 ROOT 的方法
  12. SAP UI5 应用开发教程之六十一 - 在 SAP UI5 应用里绘制甘特图 Gantt Chart 试读版
  13. 分布式数据库BLP安全模型介绍
  14. 手机游戏公司设定的客户群体是大学生和农民工
  15. php 计算工资,php计算税后工资的方法
  16. differentiable rendering可微分渲染
  17. 系统架构师—软件架构设计(二)CS/BS/SOA/DSSA/ABSD
  18. coco数据集分割可视化格式转换
  19. 允许使用计算机的软件,解决win10“你的电脑设置仅允许安装来自应用商店的应用”的方法...
  20. 小米oj 找到第 N 个数字 II

热门文章

  1. 下载Xcode历史版本方法
  2. Visual C++ 2005的现代语言特性
  3. 数据结构课程设计报告——Huffman编码
  4. linux运行fuzzbunch,方程式0day ETERNALBLUE复现之Empire ampamp; Msfconsole下的she...
  5. Dynamic Memory Based Attention Network for Sequential Recommendation【论文解读】
  6. Oracle - LOB(大对象数据类型)
  7. 上海市公积金、养老保险、医疗保险转出事宜
  8. 微信授权-获取微信授权后用户信息
  9. ABAP 将用户日期格式转换为无任何格式的日期
  10. 双十二大家都在买哪些书?这份书单请码住