当输入告别键盘,语音、表情、动作都成为输入方式,会是一种怎样的神奇体验?

1月16日,在百度输入法“AI·新输入 全感官输入2.0”发布会上,国内首款真正意义上的AI输入法——百度输入法AI探索版正式亮相,这是一款默认输入方式为全语音输入,并调动表情、肢体等进行全感官输入的全新输入产品。

同时,百度宣布语音技术取得一项对全球学术界和工业界都具备重大意义的技术突破,流式截断的多层注意力建模(SMLTA)将在线语音识别精度提升了15%,并在世界范围内首次实现了基于Attention技术的在线语音识别服务大规模上线应用。

现场,百度高级副总裁王海峰再次强调了输入法“AI落地的桥头堡”的效用,他指出,一方面,输入法是离用户最近的产品之一,另一方面,百度全方位的AI能力也在不断赋能输入法。通过AI技术的加持,用户通过文字、语音、表情、动作都能进行交互,还能实现一些更科幻的场景,高效便捷的同时也展现了未来智能蓝图。

百度高级副总裁王海峰

据介绍,截至2018年底,百度输入法月活跃人数已达5亿,语音日请求量峰值突破5.5亿,AR表情使用次数超过1亿。同时,百度海外输入法全球安装量超过1亿,支持120种语言,覆盖全球190个国家地区,并已与超过100个全球知名IP达成合作,实现技术与市场的双丰收。

视频加载中...

SMLTA语音识别精度全球领先 语音技术创新带动交互变革

百度输入法AI探索版是百度AI落地应用的又一重要成果,全语音交互是它最大的特点之一。“虽然当前输入法主流是键盘输入,但对用户需求变化的洞察,让我们有信心较早地推出这款全语音交互的产品”,百度中文输入法负责人蔡玉婷表示,相较2016年,百度输入法日均语音请求量增长了8倍,语音输入法的场景也从聊天和搜索拓展到游戏、娱乐、购物等众多场景。

百度中文输入法负责人蔡玉婷

全语音交互对于语音识别准确率要求极高,百度推出全语音交互输入法的信心,还来自于百度领先业界的语音技术。现场,百度语音技术部负责人高亮宣布了百度语音输入的四项重大突破和给输入法用户带来的体验提升。

在线语音领域,百度发布流式截断多层注意力建模(SMLTA),这是中文在线语音识别历史上的两个重大突破:世界上首次实现了局部注意力建模识别精度超过全局注意力模型;世界上第一次大规模部署在线语音交互注意力模型。这一技术能够解决传统Attention模型在识别中的时延性,以及因此导致的无法进行大规模在线语音实时交互的问题,并将在线语音识别精度提升了15%,超越行业最高水平15%。

百度语音技术部负责人高亮

离线语音识别领域,为解决用户多元输入场景的需求,百度持续优化Deep Peak 2系统,让离线语音输入相对准确率再次提升,高于行业平均水平35%。即使用户处于地铁、电梯、隧道或人流密集等离线场景中,依然可以借助百度输入法进行精准的语音输入。

中英文混合语音输入技术,以及方言与方言、方言与普通话的混合语音输入技术突破,让用户真正实现“自由说”,无论是中英文夹杂,还是普通话家乡话来回切换,百度输入法都能准确识别。据介绍,百度输入法是目前唯一实现了高精度“中英自由说”和“方言自由说”的输入法产品。

发布会主持人张绍刚体验百度输入法“方言自由说”

百度语音技术的突破同样让海外用户带来语音输入的便捷体验。本次发布会上,百度海外输入法展示了日语识别、印地语识别和印英混输功能,据第三方评测显示,百度日文输入法的语音识别精度位列行业第一,识别结果用户可接受度占比高达 90%,已成为日本最大的第三方输入法产品;印度用户语音功能的使用率已达21%,百度输入法帮助印度用户实现了自由沟通。

百度海外输入法负责人姜锋

表情、动作成为输入新方式 全感官交互创造更多想象空间

伴随着百度语音、视觉、自然语言处理、知识图谱等百度AI技术落地输入法,“全感官”的输入变成现实。除了语音输入,百度输入法AI探索版还推出了拍立活、秀场、凌空手写等新功能玩法。无论是心爱的偶像,还是日夜陪伴的宠物,“拍立活”功能都可以让用户通过自己的动作“驱动”对方做出相同表情;“秀场”功能运用图像分割技术,让用户“穿越”到不同的虚拟场景之中,科技、清新、赛博朋克多种风格随意挑选,表情创作更具场景感、更加生活化;凌空手写如同隔空打怪,在空中书写也能被流畅识别,目前整体识别率已达到大规模应用的要求。

网络红人小吴现场体验百度输入法AR表情

百度输入法全感官交互潮流也已进入海外并获得认可。据悉,借助AI技术的加持,百度海外输入法已经在全球建立起最活跃、最权威的表情社区。超级IP《变形金刚》系列首部独立电影《大黄蜂》已与百度海外输入法联手推出“大黄蜂”系列主题贴图和AR表情。

截止目前,百度海外输入法已经和Hello Kitty、小黄鸭、小王子、格林奇等全球100余个知名IP达成合作,推出了一系列深受用户喜爱的IP皮肤和表情,同时深耕本地化运营,针对海外用户还设计了本地网红合作推广等定制化传播。2018年,百度海外输入法的推广视频,总观看次数已超过1亿。

输入法本质上是一款人机交互的工具,AI时代正在到来,人机交互的形态也将随之革新。“未来,百度输入法将不仅基于手机端,还将致力于连通包括智能家居、车联网等多种终端场景,集多种输入方式为一体,帮助用户在各种场景下高效、自如地传递信息。” 百度高级副总裁王海峰表示。

百度发布国内首款AI输入法 进入全感官输入2.0时代相关推荐

  1. 百度发布国内首款云端全功能AI芯片,阿波龙L4无人车正式量产!

    策划编辑 | Vincent 作者 | Vincent 编辑 | Natalie AI 前线导读: 一年一度的百度 AI 开发者大会又来了~7 月 4 日,AI 前线记者奔赴大会前方,顶着北京的烈日骄 ...

  2. 切入AIGC新赛道,「炎黄盈动」发布国内首个AI低代码平台

    AIGC(AI Generated Content,AI生成内容)及其应用的话题正呈爆发式增长的趋势.伴随产业与技术不断渗透.融合,36氪研究院洞察到:AIGC除了在内容生产的质量.效率.及实用性方面 ...

  3. 英特尔linux手机,英特尔发布国内首款基于Linux系统深度定制的智能教育电脑

    IT之家 4 月 23 日消息 根据英特尔官方的消息,日前,英特尔与来自腾讯教育.惠普.麒麟的代表们,联合发布了国内首款基于 Linux 系统深度定制的智能教育电脑. IT之家了解到,为了填充搭载国产 ...

  4. eyemore发布全球首款AI视觉专用成像芯片,能否助推AI视觉产业跃迁?丨Xtecher 观察

    继美国的柯达.日本的索尼之后,中国的eyemore希望在AI时代扛起前端成像革命的旗帜.其发布的全球首款AI视觉专用成像芯片--eyemore X42,恰好填补了国内AI视觉的领域的空白,成为助推AI ...

  5. 华为云发布国内首个 AI 模型市场,加速企业 AI 应用落地

    华为云在 3 月 21 日的 2019 华为中国生态伙伴大会上,正式发布华为云 AI 市场:同时宣布投入专项激励,在 AI 市场上帮助开发者.合作伙伴加速企业的 AI 应用落地. 华为云 AI 市场是 ...

  6. 驱动兼容_【重磅】上海数明发布国内首款兼容光耦隔离式单通道栅极驱动器系列产品SLM34x...

    好文章需要分享哟~欢迎转载 近日,上海数明半导体又重磅推出新产品系列--兼容光耦隔离式单通道栅极驱动器系列产品SLM34x,在经过不懈的努力与克服重重难关后,该系列产品终于成功实现了国内此类产品的零的 ...

  7. html 3d手机,Egret 3D:国内首款全功能手机页游3D引擎亮相

    由白鹭时代主办的HTML5移动生态大会于12月5日在北京正式召开.会上,由白鹭时代自主研发的国内首款开源免费的全功能手机页游3D引擎--Egret 3D正式亮相,引发多方关注. 随着硬件能力的提升.W ...

  8. 【干货】百度联合清华大学发布国内首个基于AI实践的《产业智能化白皮书》(附报告全文)...

    来源:百度AI 在4月9日举行的"百度大学 Alpha 学院首期学员毕业典礼"上,百度联合清华大学发布国内首个基于 AI 实践的行业重磅报告,<产业智能化白皮书--人工智能产 ...

  9. 【每日新闻】国内首款3D AI/MR芯片即将量产

    点击蓝字关注我们更多精彩,请点击上方蓝字关注我们! 每日新闻播报 第04-22期 1趋势洞察 谭鸿鑫:科技企业估值的三大标准 清华大学谭鸿鑫表示:很多对科技企业的估值,停留在对技术的评价,其实就是无形 ...

最新文章

  1. [译]Professional ASP.NET MVC3(01)-Chapter 1:Getting Started(上)
  2. linux日常运维手册_Linux日常运维上传下载工具lrzsz
  3. Microsoft.CSharp.CSharpCodeProvider
  4. Vuex——使用namespace的store使用mapState获取state为undefined
  5. LeetCode Algorithm 70. 爬楼梯
  6. php substr 去掉前n位_PHP全栈学习笔记16
  7. android studio不能更新代码,解决Android Studio 和 Android SDK Manager 无法在线更新的问题....
  8. Kafka.net使用编程入门(一)
  9. 三星android rom开发者,六年老机吃上奥利奥:第三方三星S2安卓8.0刷机包发布
  10. QT 003 stack widget 层叠菜单的使用 - 6-04正在编辑中
  11. 帆软报表 js 调用sql_SQL Server中的报表–创建由先前创建的主报表调用的基于矩阵的子报表
  12. 程序员,别再无脑刷题了,这样学 Python,编程能力暴增!
  13. struts2 s:file标签使用及文件上传例子
  14. token会被截取吗_新手剪辑:如何截取视频的某个片段?
  15. ThreadLocal源码学习
  16. 女生学计算机和遥感哪个好就业,遥感科学与技术有性别歧视吗知乎
  17. python caffe框架_Windows下的caffe框架的配置
  18. Jedis的hget方法简单用法
  19. 墨画子卿第三章第5节:飞过去的是胧月
  20. 什么是 P、PE、CE ?

热门文章

  1. 科学道德与学风-2021雨课堂答案-第6章
  2. Caysn打印机IOS平台打印开发包及示例程序_20170610
  3. c语言中如何生成1个0到1的随机数
  4. Irene Tong的空间
  5. 本科生学深度学习-史上最容易懂的RNN文章
  6. 30万行数据,Python 分析科比二十年职业生涯 | 原力计划
  7. Qt:去掉Qt加载png图像文件时候的iccp警告
  8. bert做文本摘要_Fine-tune BERT for Summarization: BERT和文本摘要
  9. 处理nginx 文件服务器 ,log文件中文乱码
  10. 转载一条G1垃圾回收器的调优经验