业务场景:主播在讲话中的同时,自动将语音转换为文字显示在屏幕上。

解决问题:因为直播是实时性的,没有字幕,往往注意力不集中,或其他噪音干扰,就会听不清主播的话,加上字幕可以帮助未听清主播话语的观众理解主播所表述的意思,主播唱歌时可看到实时歌词,对直播片段的后期剪辑提供方便。将视频直播或现场直播中的音频实时转为字幕,为观众提供更高效的观会体验,方便对内容进行监控

挑战:因不支持离线模式,使用免费资源,转换过程中,会出现卡顿,网络延迟,识别不准确。有时会出现识别效果特别差的情况。因初次使用,出现返回状态正常,识别结果为空的情况。

使用服务:Real-time ASR语音转写服务

如何解决:调用华为云提供的Websocket接口,将音频分片传输,服务器端可以返回中间临时转写结果,在最后返回最终转写结果。针对识别效果差的情况,咨询了解后,可以设置每次分片时间50ms-1000ms,当需要实时反馈的情况下设置为100ms,不需要实时反馈的情况下设置为500ms。分片的大小可根据 位宽 * 采样率 * 分片时间(秒)/ 8 公式来计算。对于识别结果为空的情况,查看文档后知,需将音频采样率设置为8KHz或者16KHz,采样位数8bit或者16bit。提升网络情况,限制观众的发言频率,减少网络占用。主播尽量控制语速,标准发音。

使用场景:用于主播的直播间,在必要的时候可以开启语音转写功能(如唱歌,聊天等)

使用规模:2小时/每日

使用效果:更加投入主播的歌声中,显著提升观看体验,无需因没听懂主播所说而无法融入直播氛围

作者:hw81644006

asr语音转写_利用Real-time ASR语音转写服务实现直播实时弹幕提升用户体验相关推荐

  1. oracle回退脚本怎么写_短视频爆款文案怎么写?130个短视频爆款文案、脚本范例分享!...

    本文将为你解决:抖音短视频爆款文案怎么写?短视频爆款文案怎么写才能上热门?等 一个短视频爆款文案是怎样的?下面就是一例:已婚男士和未婚男士不妨思考一个这样的问题:"怎么让你的宝贝女儿未来少遇 ...

  2. python 语音朗读软件-python 利用pyttsx3文字转语音过程详解

    这篇文章主要介绍了python 利用pyttsx3文字转语音过程详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 # -*- coding: ut ...

  3. python简历项目经验怎么写_个人简历中工作经验怎么写?

    在找工作的过程中,简历的填写是一门大的学问.一份好的简历,能够让面试官,有种迫不及待想要见你的冲动,这样也才能够让你在众多求职者中脱颖而出. 很多人在填写简历中工作经验一栏时候,会出现犯难的情况.可能 ...

  4. matlab语音去除白噪声_基于的MATLAB的语音加噪去噪处理

    龙源期刊网 http://www.qikan.com.cn 基于的 MATLAB 的语音加噪去噪处理 作者:张大林 何威 李瑶瑶 来源:<中国科技博览> 2019 年第 01 期 [ 摘 ...

  5. 宜家一元甜筒背后的奥秘:如何利用峰终定律提升用户体验

    人类的记忆力其实是很短暂的,一段时间过去后,对于很多事情,我们都记不清了,只能够记得一些关键点和模糊的感受.比如我们看电视剧,过了几个月一年后,我们记不清具体的剧情了,但是我们会记得关键的剧情和大结局 ...

  6. serv-u 用户使用sftp登录 时间显示不对_从无障碍思维出发,提升用户体验

    什么是无障碍思维?如何提升?具体如何使用?文章主要从这三点出发,对无障碍思维进行了梳理分析,与大家分享. 概念说明:一种不需要定制就能满足于各类需要用户群体的思维模式. 一.概述 无障碍这个概念被提出 ...

  7. python乘法符号手写_利用Python自动生成小学生加减乘除口算考试题卷,不再为手写算术题烦恼!...

    还在为给孩子抄各种各样的口算题而烦恼?孩子上小学一年级之后,加减乘除的口算就要开始练习了,老师肯定会让家长出题.所以我们当家长的,要提前准备一下,就利用Python开发了一套自动生成小学生口算题的小应 ...

  8. aspose 换行写_利用Aspose.Word控件实现Word文档的操作

    Aspose系列的控件,功能都挺好,之前一直在我的Winform开发框架中用Aspose.Cell来做报表输出,可以实现多样化的报表设计及输出,由于一般输出的内容比较正规化或者多数是表格居多,所以一般 ...

  9. python手机代码识别数字_利用python构建神经网络识别手写数字(附源代码)

    一.运行环境配置 本次实验的运行环境win10(bit64),采用python环境为3.7.6,安装Python环境推荐使用Anaconda.Anaconda是一个免费开源的Python和R语言的发行 ...

  10. 高德地图哪个语音包最好_高德地图妲己语音

    高德地图妲己语音包是一款王者荣耀中的妲己智能语音导航,使用小妲己语音系统你可以听到妲己声音的导航,就像在玩游戏体验一样,给你别样的感觉体验,喜欢小妲己的不要错过这款语音包,快来下载. 高德地图小妲己语 ...

最新文章

  1. leetcode--链表的设计--python
  2. 在数组中查找一个数并输出所处位置
  3. 【转】Java字符串与字符集的基本概念
  4. 一天中每个小时段我都起来过,都睡过。
  5. Angular CLI创建的项目文件用途一栏
  6. echarts tooltip在图表范围内显示
  7. matlab中a k,Python:相当于Matlab的大型数组的svds(A,k)?
  8. 【RobotStudio学习笔记】(二)手动操作
  9. Android dalvik GC相关的属性详解
  10. C# 操作Excel文件之NPOI (一)
  11. 甘氨胆酸(Cholylglycine)小麦麦清白蛋白纳米粒|叶酸偶联牛血清白蛋白负载卡铂和紫杉醇靶向纳米粒
  12. 排雷日记 -- mybatisplus分页查询效率
  13. word2010制作自动编号目录
  14. 探索YoloV3源码
  15. vlc视频流转码输出配置,网页可直接访问
  16. bzoj 1921: [Ctsc2010]珠宝商
  17. 机器学习环境配置(Tesla K80安装PyTorch的全过程)
  18. 关闭win7的程序兼容性助手
  19. JdbcTemplate的增删改查用法
  20. PageHelper 分页,total总数等于每页数量的问题解决

热门文章

  1. ENVI用ROI进行裁剪
  2. 香港手机号正则表达式
  3. python导出pdf_python生成pdf
  4. Multisim BLUE14.0使用介绍
  5. 360Hbase二级索引
  6. 站在2018看单片机和嵌入式芯片方案选型和发展趋势
  7. LM2903器件使用说明
  8. 百科知识 画法几何创造性思维训练
  9. 计算机专业必须考过英语4级吗,计算机专业英语必须过六级吗
  10. 华为S2000-HI交换机与cisco的acs结合做认证