近几年内人工智能领域取得了一些重要的突破,这背后很重要的因素之一就是一项名为“深度学习”的技术

在前不久举行的一场被广泛认为是人工智能领域里程碑事件的人机对弈比赛中,人工智能取得了对人类前世界冠军的胜利。图为谷歌公司的围棋智能对弈程序“阿尔法狗”正在与韩国前世界围棋冠军李世石对弈中

谷歌公司开发的无人驾驶汽车

和许多新生事物一样,人工智能(AI)近期的发展同样经历了一些起伏和波折。在前不久举行的一场被广泛认为是人工智能领域里程碑事件的人机对弈比赛中,人工智能取得了对人类前世界冠军的胜利。然而也就在一周之前,在国外社交网站推特上一个旨在通过与真实的人类进行对话并能够从中学习的“聊天机器人”却因为网民们的恶意调侃而迅速“学坏”,很快变得满嘴污言秽语,还充斥着种族主义思想,以至测试方只能赶忙将它下线处理。

这些事情究竟是如何发生的?它们对于迅速发展中的人工智能领域研究将产生什么样的作用?

在今年3月初,由谷歌公司设计的围棋对弈系统“阿尔法狗”击败了韩国的前围棋世界冠军李世石。围棋对弈的复杂性被认为远超国际象棋,因此在此之前常常被研究人员用来评估人工智能能够达到的水平高度。而在谷歌的“阿尔法狗”亮相之前,大部分专家都认为人工智能如果想要在围棋领域击败人类顶尖水平选手恐怕还需要数十年时间的发展。

但就在这场里程碑式的胜利之后不久,微软公司推出了一款名为“Tay”的推特线上聊天机器人,其设计能够模仿一名19岁的美国少女。推特用户可以与Tay在线聊天,微软公司表示Tay能够通过这样的对话学习真实人类的说话方式并不断完善自己,并更好地与人类交流。但就在Tay上线之后仅仅16小时之后,微软就不得不将其紧急下线处理,因为这款聊天机器人开始频繁爆出粗口,其中不乏种族歧视、侮辱女性以及污秽不堪的词句。在紧急下线之后微软公司很快就此事向公众表达了歉意,同时指责这一事件是一次“针对这一技术探索项目”的“薄弱点”所开展的“有组织的攻击”。

不过尽管微软公司将这一令人失望的状况归结为黑客攻击行为。但人工智能专家,美国康奈尔大学的计算机科学教授巴特赛尔曼(Bart Selman)博士则认为,微软所称的这种所谓“技术薄弱点”似乎更像是一种过滤机制的缺陷,那就是Tay往往倾向于直接获取别人对她说过的词汇并为自己所用,而在此过程中并不加以适当的过滤。赛尔曼博士表示,他对此感到非常惊讶,因为微软竟然没有建立足够有效的安全措施来防止此类事件的发生,但他也表示,这一事件凸显了人工智能领域目前所面临的一大弱点:语言能力。

教授AI

赛尔曼博士表示,人工智能非常擅长句子解构,它们能够找出隐藏在文字背后的语法模式。这种能力让Tay这样的聊天机器人能够创建出一种符合人类语言语法习惯的句子。这种能力也正是谷歌和Skype软件翻译功能背后的技术基矗但是赛尔曼同时也指出:“但说到对于语句意义的理解就是另外一回事了。”

近几年来人工智能的迅速发展在很大程度上得益于一种被称之为“深度学习”的技术的进步,这项技术可以说在某些地方模仿了人类大脑内神经系统的运作模式。当输入海量信息时,它非常擅长从中找出某种模式,这也解释了为何人工智能领域近几年来一些最成功的突破都发生在知觉任务领域,如图像或语音识别等方面。

英国牛津大学计算机科学系助理教授西蒙威特森(Shimon Whiteson)指出,传统技术方法中,研究者必须“告诉”人工智能去看什么,它们才能去学习。而相比之下,深度学习的优势就在于这类系统能够自动发现其中的模式。

人工智能的决策网络第一层被设计用于在数据中识别一些最基本的模式,比如图像中某个物体的边界。随后这一结果被输入到第二层决策网络,后者将继续搜寻更为复杂的模式,如方形或者圆形。这一过程不断递进迭代,每一层决策网络都能够识别比上一层更加复杂的模式,于是随着时间推移,人工智能的模式识别能力不断提升,比如它能够借助低层次决策网络得到的机构外观信息最终准确地鉴别出一些物体,如一辆汽车或是一辆自行车。

威特森表示:“借助深度学习技术,你能够将海量数据输入一个大型神经网络,然后它自己就能完成从头到尾的自我训练。”

智搜(Giiso)信息成立于2013年是国内领先的“人工智能+资讯”领域技术服务商,在大数据挖掘、智能语义、知识图谱等领域都拥有国内顶尖技术。同时Giiso旗下研发产品包括编辑机器人、写作机器人等人工智能产品!凭借雄厚的技术实力,公司成立之初,就获得了天使轮投资,并在2015年8月获得了金沙江创投500万美元pre-A轮投资。

Giiso凭借公司一流的科研和技术研发团队(团队成员来自清华大学、北京大学、国防科技大学等高校的博士、硕士研究生),通过多年模式识别、递归神经网络、大数据语义挖掘技术的研发经验。自主研发了智能资讯机器人引擎,是资讯生产领域的“人脑芯片”,可以运用于各类PC软件、APP客户端、机器人或者智能硬件上,通过智能全自动的方式为人们提供精准有趣的资讯服务,成为人们生活中必不可少的“资讯管家”。

在这个信息极度爆炸的碎片化时代,如果说注意力是这个时代的人们最稀缺、最宝贵也最应该被合理利用的资源,应该没有人会有异议。依托于自主研发的Giiso引擎,智搜团队打造了首款智能媒体平台天机智讯APP,可以针对用户的各种指令或文字交互指令,聪明的回答用户各种相关资讯信息。并能够依据用户的个性化使用特征而不断的学习,持续追踪用户感兴趣的独特内容。目前,天机智讯APP6.0版本已经更新迭代完,可以应用市场下载使用。

智搜(Giiso)信息成立于2013年,是国内首家专注于资讯智能处理技术研发及写作机器人核心软件开发和运营的高科技企业。公司成立之初,就获得了天使轮投资,并在2015年8月获得了金沙江创投500万美元pre-A轮投资。

巨大的回报

这一技术的发展已经产生了一些拥有超人般能力的人工智能。赛尔曼表示深度学习系统已经被证明能够在医学核磁共振影像判读方面超越人类专家。另外还有一种技术被称为“增强学习”(reinforcement learning),该技术主要原理是机器通过奖励信号来不断修正自己的最优策略并不断进步的技术方法。加拿大人工智能初创公司“Maluuba”的首席技术官兼联合创始人卡希尔苏勒曼(Kaheer Suleman)表示,当将深度学习与增强学习两者相结合,机器还能够进行精确的虚拟仿真。谷歌公司的人工智能系统“阿尔法狗”正是通过自己与自己对弈超过数百万局,并不断总结这些对弈中学习到的方法,提升自己的技术与策略,从而迅速成为水平甚至能够击败人类最顶尖大师的围棋专家。

苏勒曼表示:“人工智能面临的重大挑战还在于那些缺乏大规模标记数据集的领域,或者难以对相关环境进行较好模拟的领域。”他说:“语言就是这种领域的一个很好例子。互联网上包含有无穷无尽的网页,但上面全都是文字,没有一个地方找得到以机器能够理解的形式所书写的关于这些文字‘意思’的内容。”

“Maluuba”公司目前正致力于开发一种算法,其能够阅读文字并回答关于这段文字的问题,但苏勒曼表示语言的一些特点让这项工作变得尤其困难。仅举一例,语言的复杂性难以想象某一段文字可以有不同深度上不同的意思,其中的每一个字、每一个词和每一句句子都有着各自的含义。这些不同的含义可以相互组成成近乎无限多的组合,而且不同的人使用语言的方式和风格又不一样。

除此之外,所有的语言都是抽象的:文字只是真实世界中事物的抽象标记,而所有这些真实世界中的事物对于机器来说都是它从未经历过的。威特森表示:“从机器学习的角度来看,学习完成后的机器水平也不过是和你输入其中的数据量所能提供的信息相当。”

由于缺乏对真实世界的体验数据以及人类社会已经积累起来的数量巨大的社会互动经验,很容易理解为为何微软公司的聊天机器人Tay无法很好地理解什么是“Holocaust”(大屠杀),以及为何否认它是一种不合适的行为。

未来发展

但尽管面临这样或是那样的挑战,Maluuba公司在上个月在论文预印本网站arXiv上贴出一篇论文,描述了该公司目前开发出的一款智能系统已经能够以大约70%的正确率阅读一篇它不熟悉的文章,并回答关于这段文章的多选题。这样的准确率水平已经超出同类其他系统最高水平15%以上。Maluuba公司研究人员所采用的技术方法结合了深度学习与神经网络结构,通过这两者之间的相互作用输出非常初级的推理结果。这家公司目前同样还致力于机器语音对话系统的开发,其设计目标是能够非常自然流畅地介入与人类之间的正常对话。

赛尔曼表示,未来在一些主题内容较为有限的领域,侧重语言能力的人工智能将拥有极大的应用前景。比如说一些技术支持热线在未来可能就将逐渐由人工智能代替,另外一些常规性的管理岗位,其职责主要就是升级一些表格并发送一些格式化的邮件,那么这样的工作就很可能可以由人工智能代替,并且它们或许可以做的更好。

赛尔曼说:“而在一些不受控制的,非常开放环境下的设置中,履行任务将需要借助人类智力的多种维度,并且需要你真正理解他人。在这样的领域,人工智能就会出现非常明显的局限性。”

但威特森也指出,即便在这些方面,进步仍然是明显的。比如谷歌公司正在开发的全自动无人驾驶汽车就是一个很好的例子。与真实的人类驾驶员所驾驶的车辆在同一条公路上行驶,计算机所需要掌握的显然并不仅仅是交通法规,它还需要能够理解并遵循一些不成文的社会准则并在避让碰撞风险时应对一些道德层面的两难问题。

正如人工智能和机器人领域的技术进展大大增加了真实世界中机器的使用量一样,机器与人类的自然互动也将不再只是停留在科幻领域。研究人员目前正在寻找新的途径来帮助机器不仅能够感知,还能够理解它周围的世界。

威特森表示:“深度学习是一项伟大的技术,但它并非万能。还有很多事情有待完善,因此自然而然的下一步,也就是人们目前正在做的事情就是,如何在深度学习中加入更多的东西,从而使它能够具备更多功能。”他说:“现在所有这些问题,包括我们需要机器做些什么,以及我们如何教会它们去做这些事,因为这些事具有现实的重要性,因此人们现在对它们更加重视了。”(晨风)

转载于:https://my.oschina.net/u/3904760/blog/1843622

为什么人工智能还远不能取代人类?语言理解能力仍然欠缺相关推荐

  1. 为什么AI的翻译水平还远不能和人类相比?

    作者 | SHARON ZHOU 译者 | 王天宇 编辑 | 2812 出品 | AI 科技大本营 [导读]前一段时间,大家都在热议 Google 的翻译系统出现了一些相当奇怪的结果,例如下图呈现的是 ...

  2. 人工智能未来是否会取代人类程序员?

       这个话题在近期来引起了很大讨论,尤其是当GPT4发布后,其展现出来的能力让很多岗位的从业者战战兢兢,比如像程序员,甚至有大佬跳出说三年 AI一定会取代程序员.人工智能和机器人是否会大规模取代人类 ...

  3. 《预训练周刊》第5期:智源等研究力证:GPT语言理解能力不输BERT、盘点NLP预训练「兵器谱」...

    No.05 智源社区 预训练组 预 训 练 研究 观点 资源 活动 关于周刊 超大规模预训练模型是当前人工智能领域研究的热点,为了帮助研究与工程人员了解这一领域的进展和资讯,智源社区整理了第5期< ...

  4. 谁说GPT只擅长生成?清华研究力证:GPT语言理解能力不输BERT

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 作者|张倩.小舟 来源|机器之心 一直以来,GPT 模型的语言生成能 ...

  5. 全面提升AI语言理解能力,达摩院自研语言模型体系登顶6大权威榜单

    8月26日,阿里达摩院语言技术实验室取得一系列突破,斩获自然语言处理(NLP)领域6大权威技术榜单冠军.据介绍,参与竞赛的6项自研AI技术均采用模仿人类的学习模式,全方位提升了机器的语言理解能力,部分 ...

  6. 人工智能会不会取代人类?

    人工智能(AI)发展到今天已经取得了相当大的成就,已经无声无息渗透到了我们的生活中,应用到了各个领域.例如:个人助理.安防.自动驾驶.医疗健康.金融.电商零售.教育,等方面. 近年来人工智能得到越来越 ...

  7. What?!人工智能还没有人类四岁儿童聪明?

    ↑即刻关注芝诺数据分析,让我们一起成长吧! 有研究表明,人工智能听上去很厉害,但目前最先进的人工智能还远远不能解决人类4岁儿童能够轻松解决的问题,那么,人工智能会变得比4岁的孩子更聪明吗?看看孩子们如 ...

  8. ChatGPT竟有9岁小孩心智?斯坦福教授逆天发现,AI统治人类还远吗

    [导读]一位斯坦福教授在上周发布的论文中证实,ChatGPT已经有9岁小孩的心智了.所以,AI离发展出自我意识还远吗?人类的霸主地位危了? ChatGPT已经有9岁小孩的心智了! 这不是什么科幻情节, ...

  9. 人工智能未来会取代人类吗?AI智能,科技正在改变我们的历史

    当今社会科技发展之快让人张目结舌,但凡对新事物的认知度不够,立刻会被社会的长河所淘汰.从摩托罗拉到现今的智能手机,甚至连政府机关也慢慢从排队办公的模式,转变成扫描二维码全程电子化程序. 小编大学时代去 ...

最新文章

  1. 计算机专业的学员为什么要学erp,对要进入计算机专业学习的人的小小建议(浅谈)...
  2. python判断是否是英文字母_用python如何判断字符串是纯英文
  3. PHP 字符串替换 substr_replace 与 str_replace 函数
  4. win10命令提示符怎么打开_Win10系统防火墙怎么打开?ARP防火墙启用步骤
  5. 亲测!这款耳机堪比 AirPods,还不到 200 块!
  6. [置顶]Win2012R2的一个Bug安装群集后可能引发的软件崩溃问题及相应补丁
  7. 自适应图片九宫格 css,高度自适应的九宫格效果
  8. 2010年篮球规则(FIBA)
  9. 机器学习和深度学习资料汇总【01】
  10. 反向题在测试问卷信效度_检验问卷的信度和效度
  11. 一世人中,最黑仔嘅一日
  12. 洛可可田浩:情感设计让产品开口说话
  13. 基本输入输出系统BIOS
  14. html图像css设置大小,关于html:CSS显示调整大小和裁剪的图像
  15. 基于ERNIR3.0文本分类:(KUAKE-QIC)意图识别多分类(单标签)
  16. 如何培养员工的团队合作精神
  17. xps in html5,XPS and OXPS file support in Windows 7 and Windows 8
  18. 新零售是否为线上线下物流三者的融合?
  19. Linux --------- 远程操作工具
  20. SEDA(Staged Event-Driven Architecture)

热门文章

  1. bootcss 向右向左
  2. WordPress星宿UI资源下载小程序源码V2.1+附教程
  3. 将图片白色区域转换成透明
  4. tensorflow 物体识别
  5. 华为OD机试真题 Java 实现【异常的打卡记录】【2023Q1 100分】
  6. FairyGUI:笔记 :Text (六)
  7. chainer-骨干网络backbone-VGG代码重构【附源码】
  8. 微信模板类H5平台有那些?
  9. 小端模式和大端模式的区别与C++代码检测
  10. 无线wifi智能小车项目java,项目案例:智能小车