前段时间, 一款主打即时性的音频社交软件火了。

音频社交春天将至?

作为一款以语音为媒介的社交软件,它的玩法非常简单。在每个房间有主持人、嘉宾、观众三种角色。主持人创建房间后,跟嘉宾聊天,观众可旁听,三种身份经主持人同意后还可转换,主播也可邀请观众上麦互动。他们以语音的形式进行交流,听后即焚。这便是典型的实时语音语聊房场景。

那么它的创新点在哪?

1、内容与玩法的创新:KOL 红人 VS. 意见领袖

2、KOL 红人:草根文化的发展,KOL 红人与普通人相同的生活方式,被更多用户所消费

3、意见领袖:通过自己多年的积累和影响力,在某一行业完成行业的带货,是行业中的明星,自带光环,受大家追捧

基于内容、玩法、亚文化圈层创新的音频社交赛道,随着 5G 时代对于音频质量的改善或将真正迎来行业爆发的春天,相较文字,语音信息量更大且更具个性化,包含的情绪和信息更丰富,可预见将会创造更多的社交玩法与场景。但快速爆发的实时音视频需求仍然面临挑战,一套成熟的音视频技术体系成为助力产品快速发展的必要保证,与此同时,音频社交的场景催生了新的合规需求,如何保证平台音频内容合规成为产品稳健发展的刚需。

一套成熟的技术体系是怎样的?

一套音频社交的搭建并不复杂,原有看起来十分高深的音视频与实时互动的技术,已经变得易于接入。

这套看似复杂的音频社交逻辑,这里做一下技术程度的拆解。

如同我们针对复杂问题的处理,都会先进行分块处理一样,音频社交的技术架构在业务角度也可拆解为:意见领袖的语音交互、意见领袖的语音处理和粉丝的音频获取三个部分来看:

1、意见领袖的语音交互

在七牛云 QRTC 的实时连麦产品加持下,通过易用的房间创建逻辑建立意见领袖的话题房间,在其他意见领袖的房间加入后,意见领袖们通过线上的连麦房间进行实时的语音互动,并且针对预设话题进行沟通交流。

七牛云的 QRTC 在开源的 WebRTC 之上,经过自有研发能力和众多客户的验证,保障了意见领袖们虽身处多地,甚至分别处于不同的国家,亦可保障通信的实时,交互延迟仅在 150ms 左右,让意见领袖虽无法见面,但犹如面对面交流般顺畅。

2、意见领袖的语音处理

意见领袖的语音交流内容经过云端的优化处理和信息审查之后,将流畅的对话语音通过成熟直播分发网络对外进行分发。

在这样云端处理的过程中,既保障了意见领袖们交流信息的完整,亦可完成对信息的内容筛查和优化。

3、粉丝的音频获取

在七牛云的直播功能承载下,意见领袖们的交流信息,通过语音的形式,呈现在粉丝们的耳边。让意见领袖们的粉丝,如同身处房间内听取自己偶像们的声音。

同时,客户端上多年的技术积累,让听众虽身处不同网络环境,都可以以最优的用户体验来获取意见领袖们的对话语音。

那么,从接入角度看,语聊房的接入又是怎样的呢?

1、意见领袖端的研发接入:

这里为研发人员提供 Android、iOS、Web 和小程序等不同系统依赖 SDK 内容,在完成 SDK 引入后,通过以下 5 个步骤的补全实现,即可完成意见领袖端的研发接入:

完成音视频核心初始化:用于初始化 SDK 中七牛音视频互动的核心能力;

进房:建立房间,并实现意见领袖的上麦。为保障意见领袖彼此的通话质量,目前支持14 位意见领袖的同时交流;

发布语音 track:监听并收集意见领袖的语音信息,建立与其他意见领袖的通话;

退房:实现意见领袖的退出房间后的多方感知;

销毁:实现整体流程结束后的资源回收。

2、服务端的业务逻辑处理:

在意见领袖端完成房间的创建和进房等操作后,服务端通过以下 3 个步骤的处理,实现多位意见领袖通话内容的直播转推逻辑:

接入服务端 SDK,完成鉴权逻辑的支持;

完成回调逻辑的支持,用于处理不同房间事件通知的处理;

建立合流转推任务,用户意见领袖交流内容,被更多的粉丝收听。

3、粉丝端的收听接入:

粉丝端七牛云也提供了 Android、iOS 等不同版本的播放器 SDK 的支持,在 SDK 的依赖引入后,通过支持播放器初始化、并且将获取到的直播地址赋值给到播放器的播放链接,就可以完成不同系统的粉丝收听支持。

监管之下的内容审核

随着国内政策对网络平台言论管理的规范化,社交平台面临的内容审核也越来越严。相比传统的音频内容审核,在语聊房场景中的多人实时语音的在线审核,非常繁杂,尤其是日活较高的社交产品,语音内容审核成本和难度更大。因为语音审核除了基础的文本分类技术外,还有三大基础技术难题,即:

语音识别:互联网语音场景常伴有强背景音、语速快、咬字不清、口音严重等情况,相比普通场景,语音识别难度倍增;

NLP:涉政、色情、辱骂等违规音频表达变化多端、内容隐晦,对语义理解的要求极高;

声纹识别:呻吟、娇喘等色情内容容易混杂在对话、歌声甚至背景音当中,声纹特征细微,难鉴别,需要极强的声纹识别能力。

七牛云针对实时音频流的内容审核场景提供色情/广告/涉政/违规等内容的识别,及娇喘类声音的识别能力。并且提供两种方式接入,帮助客户提高审核效率,净化网络环境:

直播审核 API - 适用于直播场景。实时监测,3 秒内返回结果;

文件审核 API - 适用于语音消息、文件、短视频。可以做到先审后发。

音频社交的快速发展得益于语音与文字等传统社交介质的不同优势,对于情绪恰到好处的传达,七牛云作为国内领先一站式云平台即服务(PaaS)提供商,为此类产品提供一整套成熟的音频技术体系与合规技术解决方案,有效助力客户专注业务创新获得快速增长。

化繁为简,爆款语聊产品背后的业务逻辑相关推荐

  1. 慧数汽车大数据分析:车市竞争将由打造爆款向构建“产品矩阵”转型

    在车企只要完成年销量三十万辆的目标时,只需认认真真培育出一款爆款车就足够了,如哈弗H6.完成年销量50万辆的目标时,只需认认真真培育出一两款爆款车就足够了,如哈弗H6+哈弗H2.但为什么多数车企在年销 ...

  2. 如何通过爆款文案将产品变现?产品经理给你的三大建议!

    随着我国互联网产业的快速发展,网络已成功"入侵"了我们每个人的生活!如何通过打造爆款文案,实现产品变现呢?下面看看产品经理黎想给你的三点建议: 在正式介绍前,小编先来表述一下个人观 ...

  3. 推荐系统视频行业揭秘,“抖音快手”现象级产品背后的推荐逻辑

    随着5G渗透率的快速提升,小视频应用还将迎来新的爆点,小视频行业从不缺对手,想从一片红海中脱颖而出,面临的困境可想而知.如何冲破重重困境,需要找到视频与用户之间的最佳连接,在综合成本.收益.落地难度等 ...

  4. 即构语聊房解决方案,让社交“有声”升级

    去年下半年起,音乐社交产品音遇.语音社交产品吱呀.音乐+地图社交产品spot等多款APP的亮眼表现,让我们看到了"语音+社交"的魔力.2019年春,语音社交迎来了发展的新阶段,创新 ...

  5. 实时音视频|社交直播语聊商业化解决方案

    摘要 在过去几年的直播行业创业风口期中,直播的用户关注度疯狂增长,但用户质量却参差不齐.随着用户新鲜感一过,流失率变得相当严重,各大平台都在竭尽全力防御.然而,留住"凑热闹"的非直 ...

  6. 揭秘“爆款级”产品!看葡萄城活字格低代码平台是如何诞生的

    根据海比研究院发布的<2021年中国低代码/无代码市场研究报告>分析显示,低代码市场成熟度高,正处于成长期初段.中国低代码使用人员规模达42.6万人,另外预计有164万人在使用自有或开源的 ...

  7. 小白7天上线语聊房产品,鱼哥惊呆了~

    上周,鱼哥和几个移动开发者吃饭闲聊,都聊到如今开发音视频产品,门槛较之前大大降低.2021年初,随着马斯克在应用 Clubhouse 中开麦输出,谈比特币,谈火星移民,谈脑机接口.Clubhouse ...

  8. 打造爆款产品只需四步,学会你也能爆单

    打造爆款产品只需四步,学会你也能爆单 亚马逊你会觉得难的原因 亚马逊的运营越来越难,原因无怪乎卖家越来越多所致,但亚马逊的整体体量依然保持高速增长却是不争的事实.平台体量增长,卖家的生存却越来越难,固 ...

  9. 什么是定位,如何找到与自身相符合的爆款产品丨国仁网络

    美国营销大师杰克·特劳特曾经写过一本书叫做<定位>.2009年,美国<广告时代>杂志评选<定位>为史上最佳营销经典类书籍第一名. 那么,线下门店如何精准定位? 首先 ...

最新文章

  1. 导航菜单:jQuery粘性滚动导航栏效果
  2. 关于 htonl 和 ntohl 的实现
  3. PostgreSQL将表导出为CSV(服务器端、客户机端)完整版
  4. php论坛怎么架设,论坛架设有诀窍 phpWind配置技巧三则
  5. java 反射 找不到方法_Java获取反射的三种方法
  6. keras + tensorflow —— 文本处理
  7. win7生成ssh key配置到gitlab
  8. heic怎么转换成jpg格式?
  9. Mysql 什么是聚集索引和非聚集索引?
  10. pycharm的安装,简单使用
  11. 华为od与中软外包哪个更好_记录下入职中软一个月(外包华为
  12. 【程序员学理财】零和博弈和对股市的一些了解
  13. 随身WIFI安装Debian流程记录
  14. python爬取招聘网信息并保存为csv文件
  15. WEB前端大作业-速拍摄影服务响应式网页模板(HTML JS CSS))
  16. 如何减少http请求
  17. 二维数组的认识及其表示元素的两种方式
  18. 西门子S7-200PLC自由口初始化
  19. 在国内当个程序员究竟钱途如何?2011程序员薪资调查报告
  20. Qt通讯录(语音输入+发邮件+发短信+头像)

热门文章

  1. 在线语音合成 讯飞 5-2-1
  2. Failed to execute ‘toDataURL‘ on ‘HTMLCanvasElement‘: Tainted canvases may not be exported.
  3. mysql语句错误无法退出
  4. 变态的微软Windows 7许可!
  5. windows命令行查找文件内容findstr
  6. css实现div高度自适应
  7. 腾讯短信签名方法 v3 delphi版本源码:
  8. Thread 与Runable区别
  9. 关于微信开发工具界面不一样
  10. 找到: 没有参数 原因: 实际参数列表和形式参数列表长度不同