一、在云平台创建语音技术应用

(1) 点击百度AI平台短语音识别https://ai.baidu.com/tech/speech/asr,登录百度云账号。
(2) 新用户注册完百度智能云平台后,需要在“语音技术—概览”页面领取语音识别的免费额度,否则后续功能将无法正常使用。在“概述”里面点击“去领取

(3) 单击“语音识别”——“领取免费资源”,进入领取免费资源页面;填写相应的信息,接口名称勾选“全部”。弹出领取资源窗口上显示“恭喜您,领取成功”表示领取成功。

(4) 返回上一页,点击“应用列表”,然后“创建列表”,填写相关的信息,完成语音技术应用的创建。创建完毕后“查看创建列表”(或者重新回到“应用列表”),可以看到云平台为用户生成一个用户信息,包括AppID、API Key和Secret Key

参考技术文档:短语音识别https://ai.baidu.com/ai-doc/SPEECH/Vk38lxily

二、完成的语音识别参考程序

注意:下面程序中的智能密钥我已经隐藏掉了,需要自行去百度云平台申领

import wave
from pyaudio import PyAudio,paInt16  #导入音频处理库Pyaudio,没有的话要pip 安装
from aip import AipSpeech# 设置采样参数
NUM_SAMPLES = 2000
# 默认录音4s
TIME = 4# 百度智能云平台语音技能密钥
# 请输入您的BaiduAPP_ID,下面自行调用应用哦~
BaiduAPP_ID = 'xxxxxxx'
# 请输入您的BaiduAPI_KEY
BaiduAPI_KEY = 'xxxxxxxxxxxxxxxxxxx'
# 请输入您的SECRET_KEY
SECRET_KEY = 'xxxxxxxxxxxxxxxxxxxxxxxxxx'
client = AipSpeech(BaiduAPP_ID, BaiduAPI_KEY, SECRET_KEY)# 保存录音文件
def save_wave_file(filename,data):  wf = wave.open(filename,'wb')  # 打开WAV文档wf.setnchannels(1)  #配置声道数            wf.setsampwidth(2)  #配置量化位数              wf.setframerate(16000) #采样频率         wf.writeframes(b"".join(data))  # 将wav_data转换为二进制数据写入文件wf.close()# 定义录音函数
def record():print('Start recording.')# 实例化PyAudio对象,开启声音输入pa = PyAudio()  # 打开输入流并设置音频采样参数 1 channel 16K framerate stream = pa.open(format = paInt16,channels = 1,rate = 16000,input = True,frames_per_buffer = NUM_SAMPLES)# 录音缓存数组audioBuffer = []   # 循环采集音频 默认录制4scount = 0while count<TIME*10:# 一次性录音采样字节的大小string_audio_data = stream.read(NUM_SAMPLES)  audioBuffer.append(string_audio_data)count +=1# 加逗号不换行输出print('.', end='')  print('')print('End recording.')# 保存录制的语音文件到audio.wav中并关闭输入流save_wave_file('./audio.wav',audioBuffer)stream.close()# 语音识别函数
def asr_updata():with open('./audio.wav', 'rb') as f:audio_data = f.read()result = client.asr(audio_data, 'wav', 16000, {   # 采样频率16K'dev_pid': 1537, # 1536 普通话# 1537 普通话(纯中文识别)# 1737 英语# 1637 粤语# 1837 四川话})print(result)  #打印出来,报错的时候可以查看代码val = 'result' in result.keys()print("val:",val)if val == True:   result_text = result["result"][0]else:result_text = '语音未识别'return result_textif __name__ == '__main__':record()  #调用录音函数result_text = asr_updata()print(result_text) 

调用百度云API实现语音识别相关推荐

  1. tensorflow调用百度云API实现颜值打分简单实例

    tensorflow调用百度云API实现颜值打分简单实例 首先还是在百度智能云官网注册/登陆账号,再申请一个人脸识别的API,记好API和密码,也要放到代码里面. 详细申请操作请详看tensorflo ...

  2. python 百度云api_Python——调用百度云API实现图文识别

    这是奔跑的键盘侠的第117篇文章 前几天写的一篇<按键精灵二三事系列第九篇--图文识别+发邮件>,有小伙伴留言说,可以直接调用百度云平台AI的OCR图文识别接口,不用自己单独做字库.于是就 ...

  3. 【Python】调用百度云API驾驶行为分析 Driver Behavior

    # encoding:utf-8 # !/usr/local/bin/python3# 百度云:驾驶行为分析 # 应用名称:驾驶行为分析测试import urllib3 from urllib.par ...

  4. 【Python】调用百度云API文字识别服务 OCR

    # encoding:utf-8 # !/usr/local/bin/python3# 百度云:文字识别服务 # 应用名称:文字识别练习项目import urllib3 from urllib.par ...

  5. 【Python】调用百度云API人脸检测 Face Detect

    # encoding:utf-8 # !/usr/local/bin/python3# 百度云:驾驶行为分析 # 应用名称:驾驶行为分析测试import urllib3 from urllib.par ...

  6. 【Python】调用百度云API人脸搜索服务 Face Search

    # encoding:utf-8 # !/usr/local/bin/python3# 百度云:人脸搜索服务 # 应用名称:人脸开锁import urllib3 from urllib.parse i ...

  7. 【Python】调用百度云API图像搜索服务

    # encoding:utf-8 # !/usr/local/bin/python3# 百度云:图像搜索服务 # 应用名称:垃圾分类小助手import urllib, urllib.request, ...

  8. python调用(百度云、腾讯云)API接口表格识别并保存为excel

    Python表格识别 图像识别具有较高的商业价值,本节主要通过python调用(百度云.腾讯云)API接口表格识别并保存为excel分析表格识别的能力: 提示:需分别申请密钥,在相应位置添加自己密钥即 ...

  9. SpringBoot+百度云API 实现人脸识别功能

    Java项目分享 缺项目经验的请看过来 2篇原创内容 公众号 前言 去年在公司参与了一个某某机场建设智能机场的一个项目,人脸登机是其中的一个功能模块,当时只是写了后台的接口,调用人脸识别设备的api, ...

最新文章

  1. 怎么查硬盘序列号_担心硬盘体质?不妨先给硬盘做一次体检
  2. 关于 Visual Studio 2010
  3. python爬去学校_python爬取学校教务系统
  4. Atom:A hackable text editor for the 21st Century
  5. [知识图谱实战篇] 六.HTML+D3实现点击节点显示相关属性及属性值
  6. Go基础编程:基础数据类型
  7. 大一的时候我上铺一哥们天天说梦话,一夜,他羞涩的说:“我怀孕了。”我们全体晕倒。...
  8. 《ASP.NET Core 微服务实战》译者序
  9. 使用javamail发信过程中的一些问题及解决方法
  10. 数据流中的中位数 c语言,41 数据流中的中位数(时间效率)
  11. hash function/ hash table 背后的数学基础(二)
  12. 懂商业的技术合伙人(7):怎样快速开发一个APP(2)
  13. Nodejs写的搬家工具知识分享
  14. vim - 之快速删除指定符号的内容
  15. vnc远程控制软件配置,vnc远程控制软件怎么配置的,教程详解
  16. python爬取豆瓣电影250_python爬取豆瓣电影top250数据存入数据库
  17. PCA (主成分分析)详解 (写给初学者)
  18. 微版权:用区块链破解数字版权登记难题,为原创图文知识产权保驾护航
  19. 英国AI医疗保健初创企业snap40获800万美元融资
  20. 【12c】12c RMAN新特性之UNTIL AVAILABLE REDO--自动恢复到REDO终点的步骤简化

热门文章

  1. POJ 3322 Bloxorz I(进阶指南,广搜)
  2. 计算机组成原理专有名词对应英文全称
  3. LeakCanary使用,案例静态Toast引起的内存泄漏
  4. 微信小程序中使用lodash的问题
  5. (二)arm-a上华为iot云,移植虚拟机的文件到开发板,全网首发
  6. MT7686芯片资料
  7. java以太网通讯西门子plc300_plc 400 与plc300和 300与300 以太网通讯的问题-工业支持中心-西门子中国...
  8. 西门子精智系列HMI屏幕用户管理密码组态示例(页面+IO域)
  9. Python输入圆的半径,计算圆的周长和面积
  10. python写入文件乱码\u559c\u6b22\u4e00\u4e2a\u4eba