“听声避险”?这个AI可精确辩声 帮助防盗和规避交通事故
位于英国剑桥的声纹识别技术供应商Audio Analytic公司,正致力于将以人工智能(AI)为核心的声音识别技术应用于消费设备中。就像语音识别可以识别说出的语句一样,这家公司的声音识别技术也可以分辨出狗的叫声和婴儿的哭声。
Audio Analytic首席执行官克里斯·米切尔(Chris Mitchell)表示:“这相当于一种语言模型,但它只适用于声音。”
Audio Analytic公司的声音识别AI系统AuditoryNET具有极其广泛的用途。该公司正与德国耳机制造商Bragi合作,生产拥有AI支持功能的耳机,它可通过识别救护车的警报器,并提醒用户其接近的方向,来优先考虑用户的安全。
米切尔说,这个想法是为了保护用户免受“各种危险情况的伤害,因为人们正让自己在城市里完全失聪”。
Audio Analytic公司还将AuditoryNET嵌入到智能家居设备中,如Hive Home Hub 360,它可以检测烟雾和一氧化碳探测器、吠叫的狗或窗户被打破的声音。
AuditoryNET不需要互联网连接就能运行,这对注重隐私的人来说是个好消息。
为了训练AuditoryNET的算法,Audio Analytic公司使用了世界上最大音频数据收集平台Alexandria提供的数据。米切尔说:“我们最近做的事情是绘制出我们整个声音世界的地图。”
图2:Audio Analytic公司的声音地图包含600万份音频文件,包括六种类型的餐厅窗户玻璃碎裂的声音。
Audio Analytic公司已经创建了一个包含600多万个音频文件的声音地图。它看起来就像是个彩虹蜂巢:在视觉上代表着相似的声音聚集在一起的彩色块,或称为“色调岛屿”。
米切尔表示,通过调整音量,他们的技术可以识别出有细微差别的声音。比如来自餐厅玻璃的破碎声就有6种,其中由玻璃制成的层压板的碎裂声与其他声音截然不同。
Alexandria的音频样本数据池必须从头开始构建。电影中常见的声音是没有用的,因为它们并不真实。米切尔说:“如果你去看最新的《复仇者联盟》电影,我敢肯定绿巨人会把什么东西掉在车上。”
他说:“那个汽车警报器发出的声音并不是真正的汽车警报器。”这种声音将训练AI面对虚假的现实,通常是灾难性的,比如需要检测是否有人闯入汽车。因此,该公司建立了自己的实验室来捕捉原始声音,并派出团队在各种环境中录制其他声音。
他们甚至依靠志愿者网络进入声音实验室,或者使用录音机捕捉真实世界中的各种声音。
Audio Analytic公司的未来计划依然处于保密之中,但它的目标十分明确,即继续开发识别家庭内外声音的技术,包括那些听起来像警报器的鸟鸣。
(选自:WIRED 作者:Will Bedingfield 编译:网易智能 参与:小小)
![](/assets/blank.gif)
关注 “5G” 的小伙伴看过来~
网易科技重磅打造品牌沙龙:
《5G · 未来沙龙》
我们将与行业内优秀的专家、学者、企业家,
共同探讨5G热点话题~
欢迎对5G感兴趣的伙伴们来参加我们的沙龙~
沙龙具体信息如下
本期主题:《5G将这样改变我们》
本期时间:2019年9月27日 14:00-18:00
活动地点:网易北京研发中心总部
报名条件:5G相关从业人士
(符合条件将收到网易科技邀请函)
报名渠道:朋友圈留言or私信报名
![](/assets/blank.gif)
![](/assets/blank.gif)
![](/assets/blank.gif)
![](/assets/blank.gif)
![](/assets/blank.gif)
加
入
社
群
对AI感兴趣的小伙伴,快来加入网易智能社群吧!
和我们一起探讨AI的故事~
网易智能的AI社群有很多种呢~
包括:
AI芯片、医疗AI、金融AI、电商AI、自动驾驶、
教育AI、AIoT、机器人、物流AI、等12个社群哦
快快添加智能菌微信kaiwu_club,
说明身份即可加入
我们等着你呦!
![](/assets/blank.gif)
“听声避险”?这个AI可精确辩声 帮助防盗和规避交通事故相关推荐
- AI赋能下的声纹识别技术在公共安全领域的深度应用
佳都新太科技股份有限公司 徐建明 1.声纹识别在公共安全领域的应用现状 生物特征是指每个个体所独有的.可以通过技术有效测量.甄别.鉴定与验证的某类生理上的特征或行为上的方式.从生物特征的来源进行区分, ...
- 中国人工智能产业发展指数重磅发布,中国声谷首批AI达摩名单揭晓
2017 年中国人工智能产业发展指数重磅揭晓 在今天举行的AI World 2017 世界人工智能大会上,AI Industry 分会场受到了业界的特别关注.在来自智能医疗.机器人等多个领域的知名专家 ...
- 少听大忽悠的AI万能论:不打开四道锁,企业永远无法享用AI
如果你是一位科技和AI爱好者,想必会在各种信息渠道看到"人工智能又能干什么了"."人工智能又在某领域超过人类了",这类消息近乎于每天都在我们的眼球前摇晃. 久而 ...
- 声纹采集是什么?标准声纹采集终端设备的作用是什么?
一.什么是声纹识别? 声纹识别,也叫做说话人识别是一项根据语音波形中反映说话人生理和行为特征的语音参数,来识别语音说话者身份的技术.由于每个人的发声器官(舌.牙齿.喉头.肺.鼻腔)在尺寸和形态方面不尽 ...
- 声纹识别概述(3)声纹识别系统
文章目录 1. 声纹识别系统框架 1.0 声纹识别系统 1.0.1 不太清晰的两个阶段:训练阶段和测试阶段 1.0.2 只讲了一个阶段:测试/应用阶段(包括注册和验证) 1.0.3 声纹识别系统的三个 ...
- 计算机开机滴滴叫8声,电脑无法开机!伴随8声的滴滴声! 三秒之后重复!
DELL编辑 1短-系统运行 1-内存刷新电路故障表明问题与主板关尝试重新插拔DIMM或SIMM内存您另外添加条内存请确保该内存工作速率与系统速率相同 12短 -视频适配器故障或者显存读.写错误尝试重 ...
- 计算机报警声 一高一低,有报警声电脑问题怎么处理 有报警声电脑问题处理方法【介绍】...
电脑出现问题是一般情况下会有提示,利用声音报警就是其中的一种电脑问题的提示方式.如果我们遇到了有声音报警的问题提示,我们可以依据报警声判断出问题的大致位置. 内存报警声一般为连续短促的滴滴声,而且以无 ...
- 声纹技术(七):声纹技术的未来
7.1 概述 第3 章-第6 章介绍了声纹技术的主要应用,包括声纹识别.声纹分割聚类,以及基于声纹的语音识别.语音合成.语音检测.人声分离等.这些应用很多都经历过数年甚至数十年的发展,已经变得十分成熟 ...
- 由光声前向模型求取光声信号
在相关论文中,提到一种使用光声前向模型来求取输入信号,根据公式 ,其中A为论文<Acceleration of Optoacoustic Model-Based Reconstruction U ...
最新文章
- 【Java】LeetCode 225. 用队列实现栈
- R语言Kaplan-Meier绘制生存分析、Log-rank假设检验、Cox回归曲线实战案例:恶性黑色素瘤的术后数据生存分析
- mysql补充(3)优化sql语句查询常用的30种方法
- c++11中智能指针的原理,使用,实现
- 安卓APP_ 控件(2)—— Button
- Linux IPC实践(9) --System V共享内存
- Java与Python的区别告诉你,学什么看自己
- 标准exception类层次图
- php如何跟踪调试,PHP使用debug_backtrace方法跟踪调试代码调用详解
- SQL服务器引擎组件概览
- [C指针] 用图表解读C声明:Unscrambling C Declarations by Diagram
- ctfshow-网络迷踪-新手上路 ( 使用百度搜图收集景点信息)
- iOS-国家代码选择功能github开源分享
- zlib库删除后的恢复
- rabbitmq安装erlang,报错configure: error: /bin/sh ‘/app/otp_src_20.2/erts/configure‘ failed for erts
- python毕业设计作品基于django框架 二手物品交易系统毕设成品(6)开题答辩PPT
- Android Studio历史版本
- python利用公式计算_python如何利用公式计算π
- java bitmap api,RoaringBitmap的使用
- Codeforces300D Painting Square