搜狗公司CEO王小川在2016年最后一期《一站到底》结束时为大家留下的悬念:“我会让搜狗的机器人来替我‘报仇’的!”

依约,王小川“派来”的搜狗问答机器人汪仔登陆了新年全新改版《一站到底》。在人类获胜选手以领先3分开局的情况下,汪仔最终以8:6的成绩取得了胜利,整个过程干净利落,参赛选手以及现场观众都震撼不已。

据悉,作为最终的守关大将,汪仔是搜狗历时9个月耗资4000多万打造,集合了搜狗、清华大学天工智能计算研究院等顶尖技术团队,基于人工智能技术研发的问答机器人。

搜狗汪仔机器人凭什么碾压人类?采用了哪些人工智能技术、背后开发团队如何、研发过程中最大困难是什么、汪仔和其他人工智能产品有何不同?本文对以上问题做出了简要分析。

一、汪仔和当年的Watson有什么不同?

数年前,IBM超级计算机系统“沃森”(Watson)参加了美国智力游戏Jeopardy!(危险边缘)挑战,并击败了两位最优秀的人类选手Ken Jennings和Brad Rutter。同样是答题节目,同样是人工智能,多年过去了,现在的汪仔和当年的Watson,到底有何不同?

1、输入方式不同

Watson是特殊接口文本输入,输入内容准确无误。

而《一站到底》是主持人念题加题板展示题目(两种来源都是逐字出题),汪仔通过搜狗的语音识别和图像识别技术,利用语音和图像两种方式获取,再转换成文字。语音识别、图像识别都是AI的关键技术,同时识别的错误会进一步提升答题的难度。

2、题目设置不同

《jeopardy!》的题目有显示类别和相应的奖金数,类别对于答题有帮助,能够将答案限定在特定范围内。而《一站到底》中的题目没有给出类别,需要汪仔通过算法识别问题的类别,增大了答题的难度。

当然《jeopardy!》中题目的奖金不同,最后以获得的奖金数定输赢也带来了新的问题,这点是一站到底所没有的特性。

3、赛制不同

《jeopardy!》必须主持人把题目完整念出后选手才能抢答,而《一站到底》是在开始念题后任意时间都可以抢答,答对自己得分,答错对方加分。

因此在高水平的选手有大量的题目都是在题目尚未完整时就作答,汪仔同样有很强的抢答,即根据题干片段去预测问题并作答的能力,这是Watson所不具备的能力。

4、知识获取方式不同

Watson是一个封闭系统,不联网,利用其离线的知识库答题。而汪仔通过联网,对全网信息及搜狗知识图谱进行在线答题,在利用更大范围信息的同时也对答题速度提出挑战。

5、其他

汪仔还会调侃和“撩妹”

汪仔除了能回答知识问题,还有聊天功能,可以和主持人进行自然语言交流。

二、汪仔主要基于哪些技术?

汪仔背后核心技术主要包括:语音识别、OCR、自然语言理解、数据挖掘、信息检索、知识图谱和文本计算等,这些技术是当今人工智能领域最新发展的集中体现。

其中语音识别、OCR技术代表了机器学习和深度学习的最高水平,自然语言理解是未来人工智能发展需要进一步解决的重要核心问题,代表了未来发展的重要趋势。

三、有多少软件工程师支持汪仔?

长期投入的核心开发人员在十人左右,此外还有支持项目的各类工程师约十人。

四、在汪仔的研发过程中,最大的困难是什么?

《一站到底》有个非常特殊的规则:开始读题后,任何时间都可以作答。

答对得分,答错对方加分。所以答题速度非常关键,这里不仅仅是听到完整题目后能够在极短时间内答题,更重要的问题是能够根据部分题目就预测问题并作答,实际上顶尖的人类选手也很大比例在题目不完整情况下答题。

答题速度上做了两大类事情:第一是从接收到语音、图像开始,语音识别、图像识别、搜索、答案抽取这整个系统都在速度上追求极致。在过去几个月里后台的处理速度较刚开始提升了10倍,无论是识别还是转换成文字后的问答,在速度上都做到极致。

第二类问题是推理,即根据部分信息预测问题并作答。研发团队根据学习历史上的题目,建立一套推理机制,使得机器人能够根据部分信息推理。例如 当前问题是“位于XXX的”,我们通过“位于”这个词就可以推导出问题答案是一个“地理位置”。

又例如问题中提到了“千湖之国”,则很有可能答案是“芬兰”(芬兰的别称是千湖之国),问题中提到了“穆斯林的葬礼”,则很有可能是问其作者“霍达”,这些信息是基于海量知识文本分析挖掘、学习得到的。

目前汪仔回答题目的80%都能在题目不完整时通过推理回答,较最初的版本有了质的飞跃。

五、汪仔和其他人工智能产品有何不同?

汪仔是一款自然语言问答类产品,产品功能定位决定它必须具备感知语音信号输入,并可进行认知推理的能力。

目前市面上的人工智能产品大多数仅具备感知能力,这些产品在特定领域能够辅助高效完成任务,比如语音识别类产品,可以帮助快速方便地输入文字,人脸识别类产品可以提供便捷准确的安防服务。具备认知能力的人工智能产品目前还比较少。

在自然语言理解领域,汪仔代表的智能问答就属于认知类产品,它除了具备识别人类语言文字这样的感知能力,还能够理解文字背后的含义,也就是理解人的需求,在理解需求的基础上,进一步通过推理计算获得满足用户需求的精准答案。也就是说,汪仔拥有认知推理能力。

从问答和对话领域的人工智能产品来看,和汪仔产品形态相对比较接近的包括聊天机器人和智能客服两类当前比较热门的产品。其中聊天机器人主要向用户提供生活服务、娱乐资讯等,通常以逗乐用户、打发闲暇时间为主,并不能为用户解决实际问题。

和汪仔类似,目前有些公司提供的智能客服类产品,也属于智能问答产品,同时具备感知和认知能力,但是这些产品能够回答的问题领域非常有限,基本局限在与公司产品服务密切相关的问题,而汪仔是一款通用问答类产品,它可以回答各类知识问题,不受领域限制,因此它的受众面更加广泛,能力更强。

一句话来说,汪仔是具备感知和认知推理能力的通用型知识问答类产品。


作为技术分享社区的先行者,CSDN掌握海量一手业界资料。若您对AI技术有热情,对前沿AI科技感兴趣,欢迎扫描以下二维码与我们互动。

搜狗汪仔《一站到底》完胜人类 背后核心技术曝光相关推荐

  1. 笔试代码题--搜狗--汪仔做对的题数范围

    笔试代码题--搜狗--汪仔做对的题数范围 注意:朋友对了k道题,不一定是str1中的所有对.     * 题目:总共n道题,汪仔知道朋友做的k道题是对的,他知道自己做的题目是str1,问最少对几道,最 ...

  2. 4大平台撒币,用户为何需要汪仔答题助手?

    文丨朱翊 中国互联网有云"网络无新鲜事",但在2018年刚刚伊始的第一周时间里,无数互联网用户便惊诧地发现自己的朋友圈已被一堆"撒币"活动刷了屏--花椒.今日头 ...

  3. 笔试算法题--汪仔换道具

    题目描述 汪仔最近在玩一款游戏,正值暑假游戏出了夏日活动,可以通过打副本来获得汪仔很喜欢的奖品.游戏的副本里会掉落三种不同的道具(分别是A道具,B道具,C道具),在活动结束后可以使用三种不同的道具各一 ...

  4. 当百度大脑小度完胜人类《最强大脑》

    2017年1月20号,百度大脑"小度"在国际知名节目"最强大脑"以3:1完胜<最强大脑>中国3名选手,在人脸.声音和模糊识别取得胜利,成功晋取得全球 ...

  5. 辩论届人机大战:IBM新AI完胜人类冠军!

    来源:智东西 导语:6月18日,IBM的AI系统Project Debater首次与人类进行现场公开辩论.Project Debater能够理解对方观点,并有针对性地做出清晰的反驳,最终成功战胜人类辩 ...

  6. 深度:自动驾驶特斯拉背后核心技术解析

    本文作者:魏秀参 2016-08-31 15:06 导语:深度解密自动驾驶技术,赶紧过来围观. 本文作者魏秀参,谢晨伟南京大学计算机系机器学习与数据挖掘所(LAMDA),研究方向为计算机视觉和机器学习 ...

  7. 从码农以及星际爱好者视角看AlphaStar完胜人类职业玩家

    今年一月份AlphaStar刚登场时写的文章,翻出来给大家扫盲什么是星际争霸,什么是人工智智能. AlphaStar 北京时间2019年01.24凌晨2:00,DeepMind的伦敦总部,<星际 ...

  8. 被“轻视”的CV·AR的背后核心技术

    文末有技术资料哟~ 随着近年来AI概念的大火,计算机视觉和机器视觉的应用迎来了新的机遇,而与其息息相关的核心技术之一"数字图像处理"也得到了快速发展. 数字图像处理(Digital ...

  9. 冰封王座人工只能_人工智能能否在RA2中完胜人类高手?任务模式可否自行通关?...

    这个得看做不做弊.简单来说,我只要把ai的矿全偷掉,就是它aiamp再高,再有意识,有什么用?红色警戒2是野矿,所以偷矿车这种行为有时真的是!没有矿,ai能干什么?再一个红色警戒2没有技能,单位损耗是 ...

最新文章

  1. Android之ksoap2-android详解与调用天气预报Webservice完整实例
  2. C++为什么空格无法输出_算法竞赛C++常用技巧——输入输出优化(防止TLE)
  3. OpenStack 高性能虚拟机之大页内存
  4. 机器视觉 光学工程专业_瑞士Idonus MEMS制造设备 创新技术 机器视觉测量(远心光学)...
  5. 生信人一口气搞定SCI作图与数据处理的技巧,有这一个就妥了!
  6. [日志]家居清洁十大秘笈
  7. Linux内核学习-字符设备驱动学习(二)
  8. java匿名内部类范例
  9. 小D课堂-SpringBoot 2.x微信支付在线教育网站项目实战_6-3.微信网站扫码支付介绍...
  10. HTTP代理怎样使用
  11. layui表单验证,表单提交的若干个方法
  12. android最新文献,android开发参考文献
  13. 用matlab求三次方程根,三次方程的根式求解(通俗版本)
  14. 使用SPSS对数据异常值进行探索分析
  15. JavaScript实现气球打字游戏
  16. 地铁供电系统原理图_城市轨道交通供电系统设计原理与应用
  17. POJ 1625 Censored! (AC自己主动机 + 高精度 + DP)
  18. UE4使用委托实现Actor之间的通信
  19. 【文献阅读】 Sorghum segmentation by skeleton extraction
  20. unity触发时播放音效

热门文章

  1. 后端开发语言基础介绍与比较
  2. oracle外键约束强行insert,oracle 禁用外键约束
  3. 滚动图片,滚动文字,滚动任何东西
  4. 国产远程连接工具神器---ToDesk
  5. Sass Script
  6. 爬取猫眼电影排行版TOP100
  7. html5的colgroup,HTML5 教程之HTML colgroup 标签
  8. html colgroup span,html - Span attribute on colgroup and col - Stack Overflow
  9. linux readdir64,readdir()32/64兼容性问题
  10. Arduino UNO + DS1302利用31字节静态RAM存储数据并串口打印