这个语音合成说来话长,一开始由于时间关系草草的用自动测试工具selenium解析辞典网站的方案代替,但是由于各种局限,最直接的就是要合成的内容太过单一,只能傻瓜式的去读,也就3个月之前的事,主要还是应为百度AI和腾讯AI他喵的不支持日语,其他平台那个合成 他喵的单词发音都有问题 果断放弃了,然后就用了这个自动测试插件去搞,他喵的解析HTML太憋屈了,何止一个痛苦可言,不过还是咬牙完成了。

不扯了,现在的主题是真正的语音合成,经过测试 第一,免费,当然是限量免费,这个必须在第一位;第二,简单稳定,请求接口响应正常,没啥延迟,配置也简单;第三,不用说了 那就是单词发音完美,神经TTS效果就是不一样哈,下面贴一下官网神经 TTS - Amazon Polly对他的介绍:

Amazon Polly 是一种将文本转化为逼真语音的服务,使您能够创建对话应用程序,并构建全新类别的语音功能产品。Amazon Polly 是一种文本到语音转换 (TTS) 服务,采用先进的深度学习技术来合成听起来像人声的语音。

开工吧,下面我就从5个点说明这东西怎么用好吧,原理什么的,就不说了,都是干技术活的,有啥不懂的去查就是了,要是查了还看不懂那就是理论不够了,学就完了,但是要想想对不对得起一直以来的自己。

1:文档说明

首页  https://us-west-1.console.aws.amazon.com/polly/home/,入门和文档这里 直接进文档

其实文档里面也没什么,看这部分就好

2:AWS账户和IAM用户

AWS账户就是aws这个大平台的用户了,它下面有很多吸引眼球的功能,看着挺香的,Amazon Polly只是其中一个,这么多功能管理起来了就需要一个权限的控制,IAM用就是干这个的,他是AWS的子用户,主要就是配置AWS上的功能到它这里集中使用。

AWS账户创建就不说了,创建IAM账户的话参考这里:

开始使用AWS SDK for Java2.x - AWS SDK for Java

这里必须要注意一下,密钥在IAM用户创建完后是看不了的,创建的最后一个步骤会提示下载密钥,就是那个.csv文件,这里下载保存到本地。

另外就是IAM用的的功能权限配置,如果不配置是用不用对于功能的,可以在这里配置:IAM控制台 用户管理界面,添加权限按钮

然后搜索对应功能的权限添加就好

3:demo位置

好了,权限的问题没了,剩下的就是搞代码,代码么直接搞demo,在这:

示例应用程序,不是示例代码哟,东西很少就一个类,但是要调整密钥的话还是要查下源码。

4:关于密钥

下载到本地的密钥它要求是放到固定的默认位置,程序会去读取,

但是放到外面感觉怪怪的,所以,放到工程里最好,我是这样觉得,要么就行springcloud一样搞个配置中心,总之要让人觉得好维护。

所以,这样:

把DefaultAWSCredentialsProviderChain换成SystemPropertiesCredentialsProvider就好

具体的看这两类的源码就知道了,接口返回的是InputStream流,我们把它保存到本地mp3格式就好。

下面是我的成果:

怎么样,很简单吧~kiki~

5:后续说明

在写这个文章前,我是不想写的,一开始我是拒绝的,因为我觉得就这么点东西,写的话太费时间了,还不如向老师一样直接搞直播录视频,那样记录的又快又多,又清楚,但是,但是我他喵的在国内的虎牙直播用不了,由于在海外,它不能开播,,于是我又看了各大平台好像都不能在PC上搞,抖音可以,但是要1000个粉丝啊,我他喵的生不起1000个,又看了微信的微赞,也是好像不能在PC上操作,,哎 难啊,算了,总之如果后续我以视频的方式保存技术经验的话我会在CSND博客文档里说明的,大家多多关注。

关于 Amazon Polly 语音合成相关推荐

  1. polly php实例,亚马逊Amazon Polly文本转换语音PHP简明调用示例

    官方介绍Amazon Polly使用深度学习将文本转换为逼真的语音 ,18年下半年更新支持了中文,现中文也只有Zhiyu一个播音员,Amazon Polly除了官方调用示例不是很多,下面我给大家展示一 ...

  2. 亚马逊的策略分析:不仅仅是电商,AI构建新的业务支柱

     亚马逊的策略分析:不仅仅是电商,AI构建新的业务支柱 乐邦 来源:网易科技报道 2017年04月26日 09:30评论(4 ) 4月26日消息,市场研究公司CB Insights近日发布报告全面 ...

  3. 自然语言处理实战——巧用 Amazon Comprehend 分析社交媒体数据

    摘要 自然语言处理 (NLP) 是语言学.计算机科学和人工智能的一个子领域,涉及计算机与人类语言之间的交互 (引自维基百科)[1].NLP 的目标是让计算机理解人类所说和所写的内容,并以同样的方式进行 ...

  4. amazon白皮书学习 II

    整理花了很多时间,CCP不需要知道这么多,还是刷题吧,至于题目嘛-- Machine Learning - 42 Amazon SageMaker 是一项完全托管的服务,可以帮助开发人员和数据科学家快 ...

  5. 2018年13个AI趋势 | CB Insights报告

    李根 发自 凹非寺  量子位 报道 | 公众号 QbitAI CB Insights最新的AI报告,预测了2018年13个AI趋势. 其中关于中美双雄时代的趋势,量子位之前已经专文搬运过,其中核心要点 ...

  6. 城市云脑研究之三,人工智能在城市云脑建设中的地位与作用

    作者:互联网进化论作者,计算机博士刘锋 城市云脑研究之二<城市云脑,像大脑一样建设智慧城市,基于互联网云脑的新架构>一文中,介绍到:"从1969年互联网诞生以来,人类从不同的方向 ...

  7. 亚马逊AWS机器学习答案-练习题

    本人所整理的劳动成果,转载请务必注明出处,谢谢! 有问题欢迎评论区讨论交流,大家一起学习~ [Module 2 - Introducing Machine Learning] 1.机器学习是有关算法和 ...

  8. Python 人工智能:11~15

    原文:Artificial Intelligence with Python 协议:CC BY-NC-SA 4.0 译者:飞龙 本文来自[ApacheCN 深度学习 译文集],采用译后编辑(MTPE) ...

  9. AI开发人员使用频率最高的10个机器学习平台!

    导 语 机器学习平台正在蓬勃发展.开发人员需要知道如何以及何时使用他们.在机器学习环境中工作,使用像Filestack这样的合适工具的同时,可以使开发人员更容易创建一个能够发挥其功能的高效算法.以下机 ...

最新文章

  1. 在机器学习分类中如何处理训练集中不平衡问题
  2. leetcode 小青蛙跳梯子
  3. 罐中研讨会:设置JBoss BPM Suite全天研讨会
  4. leetcode236 二叉树的最近公共祖先
  5. The stacking context
  6. FCKEditor的用法与下载
  7. 【大屏可视化模板】vue-dataV-echarts-elementul大屏数据可视化方案,屏幕适配方案等比例缩放
  8. 微信分享第三方网页链接自定义标题、描述、图片
  9. html简单图片轮播的实现
  10. 20200608模拟赛 Endless
  11. 通过GPRS 模块M26程序实现 实时时钟
  12. 创业公司产品经理的进阶思考
  13. 计算机图形输入的原理,【计算机图形学】零 · 计算机图形系统概述
  14. 直流无刷电机【一】从零开始上手
  15. Proteus8 发生关键仿真错误
  16. 文件上传漏洞靶场upload-labs学习(pass11-pass15)
  17. oracle的路由器,如何充分使用Oracle?
  18. java后端内部面试题
  19. 【云原生之Docker实战】使用docker部署Monica个人开源CRM系统
  20. Windows安装Scoop失败解决方法

热门文章

  1. 抓取猫眼top100电影信息
  2. 转转JAVA开发面经
  3. 行式数据库 和 列式数据库
  4. testlight必备t66_ios安卓.y /apps/android官方兑换码开发包安装_安卓_ios
  5. delphi 编译生成ipa文件 adhoc步骤
  6. HTML 空格位占位符
  7. Python技能树,新版题库,值得一键三连~~
  8. 前端 华为OBS 上传图片和查看图片
  9. 2022年NOC大赛创客智慧编程Python决赛用题
  10. java 线程假死_Tomcat假死的原因及解决方案