如今,汽车业向智能辅助驾驶系统和车载信息化的方向发展趋势逐渐加快,语音识别技术在车联网领域的应用已成为车联网智能化发展的助推器。那么什么是语音识别技术呢?其实语音识别是一门交叉学科,涉及到从语言学到通信理论等方方面面的内容。要实现它,也需要海量语料收集、实测模型训练再到识别匹配等等一系列复杂的过程,涉及到声纹、TTS、ASR等等一系列技术,同时也要对一些特定领域有着深入理解。此外,也需要软件、硬件的共同配合协同。总体来说,这是一个需要门槛极高,对专业性、投入等都要求很大的工程。

致力于车载人机交互系统开发、车联网服务平台运营的国内智能汽车运营商车音网,在语音识别方面,拥有十多年的积累,也是中国最早一批开拓中文语音识别商用化、产业化以及车载语音识别的奠基者。为此,本期电子发烧友网汽车电子特刊诚邀车音网创始人兼董事长沈康麒先生探讨车载语控相关问题。

车音网创始人兼董事长沈康麒先生指出,车音网自然语言导航只是车联网应用的一部分,其自然语言识别技术在智能化交通领域的大门已然开启,下一步将是步入行业的高速发展之路,智能化汽车也将走入更多人的生活。

如何抓住用户需求痛点?

与单纯的语音识别公司相比,车音网有很多不同点。沈康麒先生表示,除了车载语音识别之外,车音网同时还拥有车载手机互联以及基于NGTP 2.0标准的车联网平台等核心技术,为汽车主机厂等合作伙伴提供完整的车联网解决方案。在此基础之上,车音网还深入汽车全生命周期,为车企提供后市场服务、用户管理、电商等服务。

然而,语音识别虽好,但是必须要认清,在一些场景下,语音识别并非最佳解决方案,不是不能识别,而是没有必要去用它。例如打开车窗,用手去操作或许比起语音要更为方便。沈康麒先生指出,要摒弃纯技术思维,而要将用户体验放在最重要的位置。

如何衡量用户体验?一方面是语音的识别率,是90%还是95%,这个当然可以用数字去衡量。另一方面,要强调服务的达成率。这一点就与场景、硬件、识别引擎、数据积累、对用户习惯的考量等等都有关。同时,要明白语音识别是一项工具型技术,通过这一工具,能更好满足用户实际的需求,比如语音搜索、语音电台等等。

克服设计挑战 展示独到优势

车音网最大的特点就是专注,发展方向定位在了汽车相关的场景上,多年来见证了车载语音的不断发展,沈康麒先生表示在设计方面有两大挑战:

其一,由于汽车环境非常复杂,有噪音、回声的干扰,对识别技术是一种挑战。例如在采样时,大量收集实际场景下的语料,得到在车载噪音下更好的识别率,同时,在不断探索汽车环境下,用户提出了高频需求。沈康麒先生表示,这些可以不断优化体验效果,让识别的精度更高,随着用户使用,语音识别的模型也在不断完善。

其二,语音技术本身是一项概率技术,任何语音识别的模型都存在一定的局限性,即使该技术能够做到精准,外部的不可抗因素也可能会导致语音识别失效。当然了,车音网提供的车载语音识别,不是一套冷冰冰的机器,一旦用户在使用过程中出现无法识别的问题时,客服专员还会第一时间接入,通过人工的方式满足用户的需求,提升服务的达成率。总而言之,设计者应该更多地以用户的应用场景以及应用需求为出发点,去开发及设计语音产品。

打造中国智能汽车服务运营平台

目前人机交互正在从机械按钮,逐渐过渡到触摸。而在车载环境下,语音交互可以说是当前最佳的人机交互方式,它能极大程度提升驾驶安全性,为用户带来便利,这一点,也越来越多地受到了人们的认可。

沈康麒先生表示,语音识别、车载手机互联以及车联网平台都是车音网的核心技术,在此基础之上,车音网还在开发了自主OS系统,将云应用平台与智能语音平台相结合,围绕车主生活核心需求定义未来智慧车生活。车音网的定位是智能汽车运营商,将遵循为车企提供伴随性服务的原则,围绕整个汽车生命周期,为客户及用户创造更大价值。

同时,车音网也并不是一家传统的TSP公司。他们所做的是为车企提供伴随性服务,搭建一个贯穿车主全生命链周期的服务运营平台,帮助车企做车联网服务的落地,提升用户的满意度和忠诚度,这也就是车音网所说的 “中国智能汽车运营商”,核心在于软件开发和对不同服务的综合运营。

未来车联网、汽车智能的渗透率还将不断提升,对人机交互的需求非常大,更重要的是,在车载环境下,语音识别有着无法替代的优势。从发展的角度来看,那些最专注、最专业的企业,会更有希望最终成为胜利者。沈康麒先生强调,基于语音识别的车联网应用服务,也是我们未来的重点之一,目前语音识别已经炙手可热,整体市场还有很大的潜力空间。

本文选自《汽车电子特刊》,更多优质内容,马上下载阅览

本土黑马谈车载语音识别 - 汽车电子 - 电子发烧友网相关推荐

  1. 基于HMM的连续小词量语音识别 - 模拟技术 - 电子发烧友网

    相关推荐 人工智能在经历了迅速发展之后,AI 领域的人才需求也发生调整.近日,猎聘联合 GMIC 发布了< 2... 发表于 2018-04-12 15:38 • 63次阅读 确定最佳深度可以降 ...

  2. c语言和远光灯标志,汽车仪表盘图标大全,汽车仪表盘指示灯图解 - 汽车电子 - 电子发烧友网...

    对于开车新手来说,熟悉汽车仪表盘可以增加开车的安全感,本文将为大家介绍汽车仪表盘图标大全. 汽车仪表盘图标大全: 车内各类仪表指示灯 1.ABS指示灯 该指示灯用来显示ABS工作状况.当打开钥匙门,车 ...

  3. NFC中国-中国第一NFC论坛,NFC中文论坛+NFC技术社区+NFC_电子发烧友网【申明:来源于网络】

    NFC中国-中国第一NFC论坛,NFC中文论坛+NFC技术社区[申明:来源于网络] NFC中国-中国第一NFC论坛,NFC中文论坛:http://nfcchina.org/forum.php NFC技 ...

  4. 通用计算机生命周期,产品全生命周期通用代码在中 - 电子技术 - 电子发烧友网...

    相关推荐 官方提供了10万张图片,我们可以直接使用官方数据进行训练,也可以通过Captcha,参照官方训练集,... 发表于 2018-04-04 08:51 • 1255次阅读 PLC编程中的计时器 ...

  5. 语音识别电路设计图集锦 - 嵌入式类电子电路图 - 电子发烧友网

    TOP2 语音识别机器人系统电路 系统电源电路设计 SPCE061A采用低电压供电方式,这可以大大降低芯片的功率损耗.其中,SPCE06lA的电源分两种,即内核电源(VDD)和I/O口电源(VDDH) ...

  6. 计算机怎样去掉语音,如何关闭word语音识别 (数据丢失 - 电脑使用小技巧 - 电子发烧友网...

    如何关闭word语音识别 (数据丢失) 关闭语音识别 单击开始,然后单击控制面板. 双击"区域和语言选项". 单击语言 选项卡,然后单击详细信息. 在"已安装的服务&qu ...

  7. 虚拟机做dcs服务器,虚拟机技术的DCS仿真 - 机械设计 - 电子发烧友网

    随着工业的发展,DCS(Distributed Control System)的应用越来越广,但是由于DCS本身的分散控制集中管理的特点必然导致其存在一定的复杂性,不会像普通系统那样容易使用,所以在D ...

  8. cd4013编程c语言,cd4013中文资料汇总(引脚图及功能_工作原理及方式_功能结构_参 - 电气技术 - 电子发烧友网...

    CD4013是CMOS双D触发器,内部集成了两个性能相同,引脚独立(电源共用)的D触发器,采用14引脚双列直插塑料封装,是目前设计开发电子电路的一种常用器件,它的使用相当灵活方便且易掌握,受到许多电子 ...

  9. html做万用表效果,牛人DIY高精度六位半数字万用表 - 电子制作 - 电子发烧友网...

    概述: 数字多用表是常用的测量仪器,目前市场常见的是3.5(三位半)和4.5 手持表,用于一般测量,另外高端的则是6.5位以上的台式表,价格较高,用于高精度测量. 随着电子技术的进步,高性能低成本的器 ...

最新文章

  1. json数据交互与@RequestBody
  2. 3.Programming in TensorFlow and Keras
  3. 【Java】浅析八种基本类型和包装类型
  4. 代码管理_阿里巴巴自研代码管理平台技术解密
  5. NOX的使用之学习篇【一】
  6. killall命令_没想到Linux命令也有“吓人”的一面……
  7. offset must be non-negative and no greater than buffer length (0)(tensorflow.keras)
  8. java--idea--生成jar包-2
  9. matlab半波整流怎么做,基于Matlab的单相半波可控整流电路的设计与仿真.doc
  10. Objective-C学习笔记(1)——OC的基本概念和类
  11. 动点四边形周长最短_中考数学之四边形周长最小值
  12. 经常听到卡农吧,可是你知道卡农背后的含义么?
  13. 深圳南山区学位申请特殊住房需要的材料有哪些
  14. 电脑播放视频报错----------无法播放。请确保你的计算机的声卡和视频卡可以使用,并安装了最新的驱动程序----------解决!
  15. Dubbo 支持哪些通信协议?
  16. 分频电路的verilog实现
  17. #Op Jerusalem(耶路撒冷活动)之奇妙过程记载: 我裤子都脱了你给我看这个?
  18. En-Tan-Mo(ETM)项目周报(6月14日~6月20日)
  19. jq html 回车提交表单,jQuery事件之键盘事件(ctrl+Enter回车键提交表单等)
  20. Dubbo面试专题总结

热门文章

  1. [GO]结构体及普通变量初始化
  2. Scrapy学习-13-使用DownloaderMiddleware设置IP代理池及IP变换
  3. Java设计模式中的单例模式
  4. Android 系统编译环境设置及源代码编译
  5. iOS开发之在地图上绘制出你运行的轨迹
  6. HDU2148 Score【序列处理】
  7. Vijos P1127 级数求和【数列】
  8. Xavier Initialization 的理解与推导(及实现)
  9. Python 面向对象 —— 特殊函数(setattr、getattr、hasattr)
  10. utilities(matlab)—— 图像加噪