来源:澎湃新闻

本文约3800字,建议阅读10分钟。

孙教授与你分享当下人工智能的发展、困境与解决方法。

正如人类会综合利用视觉、听觉、触觉、语言等信息,让人工智能(AI)从多角度、多模态、多学科学习自然语言也是清华大学人工智能研究院的目标与任务。

2019年7月1日,清华大学人工智能研究院第八个研究中心:自然语言处理与社会人文计算研究中心(以下简称中心)在校本部FIT楼举行成立仪式。中心主任由清华大学人工智能研究院常务副院长、国家重点基础研究发展计划(973计划)项目首席科学家孙茂松教授担任。

7月3日,记者走进清华园,与孙茂松教授聊了聊这个名字格外长的中心成立的背景、担负的使命、以及当下人工智能的发展、困境与解决方法。

孙茂松教授接受记者采访

AI诗人、人工智能辅助法官与未来的诺贝尔经济学奖获得者

语言是人类智能的重要标志,在人类文明中的地位与作用毋庸置疑,自然语言处理,通俗地解释就是“让计算机学习人类语言”。清华大学新设立的中心旨在通过加强人工智能的基础研究及其与人文社科学科的交叉合作,建立更强大的机器用知识库,进而提升人工智能对语言的学习和处理的能力。

孙茂松认为,目前人工智能同社会科学和人文科学的结合有两个主要的桥梁,一个是狭义的数据,比如说金融市场上的数据,可根据数据来预测市场行为;另一个就是语言文字形成的文本,比如新闻、消息、用户在社交网络上反映观点和情绪的各种“短信息”等等。

基于人类语言文字这一桥梁,自2015年底起,他指导一个最初以两位本科生为主体的课题小组,通过深度神经网络的方法,让机器对全部古代诗歌进行“阅读”并“理解”,在此基础上,推出了会作诗的AI——“九歌”,使人工智能“跨界”到了文学创作领域。由于公众的关注与参与,到目前为止“九歌”已经产生了差不多400万首诗,“从古流传至今的诗歌总量估计达不到400万首,如果这么想,效果也还不错。”小组目前正在研究现代诗的生成,以期满足大众越来越多样的“作诗要求”。

“九歌”在CCTV-1《机智过人》节目上创作出藏头诗

社会人文学科是一个很宽广的概念。除了文学外,今年以来人工智能研究院正在与清华大学法学院合作,在原有的法学基础上更多地加入计算与人工智能的成分。法学院越来越认识到,“计算法学”是未来法学研究的一个发展趋势。孙茂松也提到,近年来最高人民法院领导的案卷卷宗数字化、公开化是计算法学发展的一个重要基础。

当记者问未来是否会有“AI法官”时,孙茂松说,“应该会有‘人工智能辅助法官’。虽然本质上机器的能力肯定超不过优秀的法官,但机器确实有它的长处,比如说它可以快速阅读大量的卷宗,人有时候会判断有片面性、情绪上会有所波动、法官水平也会参差不齐,机器则不会。”

孙茂松指出,人工智能目前基于大数据的深层神经网络方法(也叫深度学习方法,见后)有可能为某些社会人文领域带来研究范式的改变。虽然清华人工智能研究院目前刚刚开始进行外汇兑换率预测的研究,但他认为人工智能与金融、经济的深度融合可望带来极具震撼力的成果,一旦深度学习方法被创造性地、系统性地应用到这个领域,甚至“这几年国际上能出一个诺贝尔经济学奖”。

针对金融、经济系统的高度复杂性,孙茂松认为,当把各类相关信息都涵盖进来,并且有高超的手段对这些信息进行“大一统”式的有效处理时,这个复杂系统的可预测性便会显著上升。他举了个例子,“蚂蚁王国有自己的一套运作规律,但这个规律有时会变得非常脆弱,因为可能突然来一个人,啪地来一脚,便给这个王国带来了灭顶之灾。仅仅从蚂蚁的世界来看,这个突发事件是不可预测的。但如果把人的因素包含进来,细致了解这个人的秉性,比如他是否是一个有爱心的人、是否是一名佛教徒等等,他的行为的可预测性就会大大提高,蚂蚁王国的不可预测性也会随之大大降低”。

在孙茂松看来,经典金融学或经济学的研究范式主要是依靠人的理性思辨和求解方程(无论是线性还是非线性方程)。但复杂且庞大的金融和经济系统里充满了不确定性,很多现象难以用方程显式地刻画。但深度学习方法具有高度的非线性性质,在大数据的驱动下,理论上它能隐式地模拟任何复杂的方程,更加有效地处理系统的不确定性。这就使得一种全新的金融学或经济学研究范式的产生成为可能。

把“黑盒子”变成“灰盒子”

孙茂松的书架上摆着金融、语言、逻辑等各领域的书籍

“当代人工智能教父”、2018年图灵奖得主约书亚·本吉奥(Yoshua Bengio)认为,人工智能领域在近些年出现巨大变革要归功于 “深度学习”(deep learning)的出现。他在一篇名为《深度学习:人工智能的复兴》的署名文章中说,“近年来,深度学习已经成为了驱动人工智能领域发展的最主要力量,各大信息技术公司在这方面共掷下了数十亿美元的资金。”

本吉奥此前接受记者专访时表示,现有的自然语言处理系统掌握了大量的词汇量和语言转换的技巧,但是却并不理解句子的真正含义,机器“会犯一些非常愚蠢的错误,甚至没有两岁小孩的理解能力”。同时他认为,模拟人脑的神经网络以期能够实现类人工智能的机器学习技术,即神经网络技术对于新时代的意义是巨大的。

尽管意义巨大,但目前的深层神经网络系统存在着一个重大不足:给定一个输入,系统给出相应结果的深刻原因对人来说是不透明的,从这个意义上来说,它基本上是一个“黑盒子”。这就导致系统的稳健性会变大打折扣,系统的适用范围也会缩窄。当我们深究机器为什么犯错时(如机器翻译系统为什么把一句话翻成这样、而不翻成那样),机器却无法给出解释,“反正我就翻成这样,你看着用吧。”


此外,深度学习最擅长处理的是关联性:
当输入“公鸡打鸣”这个词语时,它会自动联想到“太阳升起来了”这句话。这体现了一种关联性,但显然前者不是导致后者的原因。深度学习现在基本上没有因果推理能力。孙茂松说,深度学习只是在统计意义上“觉得”某两个东西是相关的,但两者之间到底有没有逻辑关系,它却浑然不知。

孙茂松进一步阐释,自然语言处理研究面临着同样的难题,实际上,“可解释性”是整个人工智能领域目前面临的困境,也是目前的国际学术研究前沿。研究者们正在努力让这个人工智能“黑盒子”至少变成一个“灰盒子”。孙茂松认为,在自然语言处理方面,知识库的构建或许是一个解决方法。以古诗词写作举例:“灞桥”后接“折柳”,深度学习应该能从诗库中捕捉到这个知识关联,但其它众多知识关联是否都能学到,就不好说了。但如果我们自觉地把跟“灞桥”相关的东西全预先列出来,如“灞水、驿站、销魂、断肠、长安、关中八景、李白、李商隐、孟浩然…”,建立起一个知识图谱,那么,机器就可以根据这个知识图谱比较自觉地去写诗,针对性更强,写诗过程也便具有了一定的可解释性。

根据人工智能研究院院长张钹院士的说法,人工智能在其发展史上已经先后经历了理性主义和经验主义两代。第三代人工智能应该是这两者的完美结合。解决可解释性问题,是其核心研究任务之一。

因为知识天然地具有一定解释性,知识库就带有一种可解释性。

“通专虽应兼顾,而重心所寄, 应在通而不在专。”

以人工智能和大数据为标志的第四次工业革命到来之际,国内多所高校开始布局人工智能教育。2017年5月,中国科学院大学成立人工智能技术学院,成为我国人工智能技术领域首个全面开展教学和科研工作的新型学院;2018年,上海交通大学与南京大学先后建立了人工智能研究院与人工智能学院,南京大学还招收了首批人工智能专业本科学生。

而作为中国顶尖的高等学府,清华大学对顶尖人才培养一贯高度重视。2005年设立的计算机科学实验班(因其创始人、“图灵奖”唯一华人获奖者姚期智而得名“姚班”)是全国乃至全球领先的计算机人才培养的摇篮。一流的高等教育有责任助力计算机科学和人工智能达至下一个令人鼓舞的高度,更应该能够给这个时代带来颠覆性的影响。

那么,人工智能本科专业的设置是否必要?人工智能要不要在本科阶段就独立成系?

“通专虽应兼顾,而重心所寄, 应在通而不在专”,孙茂松用清华大学老校长梅贻琦的一句话为记者解释了国内顶尖高校对于人工智能本科教育或许应有的态度。在参考了全球名校如MIT(麻省理工学院Massachusetts Institute of Technology)、斯坦福大学、CMU(卡耐基梅隆大学Carnegie Mellon University)等的课程建构后,孙茂松认为人工智能不应贸然独立于计算机科学技术的一级学科。当然,各个高校根据各自不同的情况和需要制定自己的发展策略,也是可以理解的。

“清华主要的还是要稳,没有特殊的需求不要变,一变反而变乱了,两拨人可能无序竞争了。” 整体稳定、积极探索是清华大学在人工智能本科教育上的方针。

今年,清华大学在“姚班”之外新设立了“智班”,全称为“清华学堂人工智能班”,在计算机教育结构大体不变的前提下,这个规模不大的实验班将对人工智能人才、特别是顶尖人才本科阶段的培养进行深度探索。而人工智能研究院的工作主要定位在研究生阶段,特别是博士生阶段的培养。

在本中心之前,清华大学陆续成立了人工智能研究院基础理论研究中心、智能机器人研究中心等七个研究机构。

孙茂松说,这八个中心的核心力量主要对应着人工智能研究的“初心”,也就是研究人的感知和认知。感知最重要的通道是视觉和听觉,所以设立了视觉智能和听觉智能中心;而认知体现人的语言、推理、逻辑、学习的能力,所以设立了基础理论中心、知识智能中心和自然语言处理中心等。再向外探索就是智能人机交互与智能多模态信息交互乃至机器人的相关研究,中心和中心之间是紧密联系、相互合作的。

刚满一周岁的清华人工智能研究院已基本实现了“整合力量、统筹安排”的目标。孙茂松表示,接下来的两个中心会分别以“社交网络大数据”“人工智能芯片”为关键词。

编辑:黄继彦

校对:林亦霖

对话清华教授孙茂松:第三代人工智能要处理“可解释性”问题相关推荐

  1. 清华大学人工智能学院常务副院长孙茂松:AI与行业深度融合还有巨大的潜力空间

    当"无接触"开始成为疫情中的现实需求,AI这个曾经引发过数次热潮的产业从幕后走向前台,逐渐成为人们视线的焦点.未来AI与产业的关系将如何发展?学术界和产业界对此又有何看法? 202 ...

  2. 清华自然语言处理科学家孙茂松:深度学习碰壁之后,我们还能做什么?

    来源:AI前线 本文约5300字,建议阅读11分钟. 清华自然语言处理科学家孙茂松为你解答深度学习. [ 导读 ]10 月 31 日,北京创建全球人工智能学术和创新最优生态的标志性学术活动" ...

  3. 高考报 AI 专业?南大周志华:当然!清华孙茂松:再考虑一下

    By 超神经 场景描述:又到了高考放榜的时刻,接下来就是准大学生们选专业的环节.「人工智能」首次成为本科可选专业,在风头正盛的当下,到底该如何去抉择?不妨从行业大佬以及网友的看法中,去看看热潮背后的冷 ...

  4. 南大周志华vs清华孙茂松深刻思辩:AI本科教育该不该单独设系?

    问耕 夏乙 发自 凹非寺 量子位 出品 | 公众号 QbitAI 如何培养人工智能人才?中国大学该不该设立人工智能本科专业? 在昨天的<AI人才教育高峰论坛>上,清华大学计算机科学与技术系 ...

  5. 清华人工智能研究院孙茂松:大数据与富知识双轮驱动成NLP未来发展关键

    来源:大数据文摘 本文约3500字,建议阅读7分钟. 孙茂松副院长为你介绍大数据与富知识双轮驱动成NLP未来发展的关键. 10月8日,北京智源人工智能研究院在清华大学FIT楼举行了"'自然语 ...

  6. 马斯克失去世界首富头衔/ 清华孙茂松当选ACL Fellow/ VR头显可隔空接吻…今日更多新鲜事在此...

    日报君 发自 凹非寺 量子位 | 公众号 QbitAI 大家好,今天是12月13日星期二. 北方很多地方气温已降至零下十度,出门记得多穿点- 科技圈都发生了哪些大事? 一起来看看. 马斯克不再是世界首 ...

  7. 特约专栏丨孙茂松教授——自然语言处理一瞥:知往鉴今瞻未来

    来源:中国人工智能学会 文 :孙茂松 人类语言(即自然语言)的重要性无论怎么讲都不为过.社会生物学之父爱德华·威尔逊曾说过:"语言是继真核细胞之后最伟大的进化成就".科普畅销书&l ...

  8. 客座编辑:孙茂松(1962-),清华大学计算机科学与技术系教授,博士生导师,党委书记。...

    孙茂松(1962-),清华大学计算机科学与技术系教授,博士生导师,党委书记.2007-2010年任该系系主任.现任清华大学大规模在线教育研究中心主任,教育部在线教育研究中心副主任,清华大学-新加坡国立 ...

  9. 清华大学孙茂松当选 2022 年度 ACL Fellow

    他曾领导开发了 AI 作诗系统"九歌".学堂在线. 作者 | 李梅    编辑 | 陈彩娴 来源 | AI科技评论 近日,国际计算语言学协会(ACL)官方公布了 2022 年度 A ...

最新文章

  1. 2022-2028年中国实心轮胎行业市场研究及前瞻分析报告
  2. R语言ggplot2可视化散点图并添加平滑曲线、WVPlots包BinaryYScatterPlot函数可视化一起中一个变量为二元离散变量的散点图(随着年龄变化是否有健康保险的客户的比例)
  3. HDOJ 1036 输入输出 水
  4. Python之pandas:pandas中数据处理常用函数(与空值相关/去重和替代)简介、具体案例、使用方法之详细攻略
  5. 职业技术人士学习捷径最快的网站
  6. javascript ep
  7. Linux系统编程三:使用man查看帮助文档
  8. C语言/C++程序必须从main函数开始吗?main函数执行完后还执行其他语句吗?
  9. 信号与线性系统分析(吴大正,郭宝龙)(5-系统定义与典型系统)
  10. 山大计算机学院教务处,山东大学本科生院教务系统
  11. vue中pdf预览组件_基于vue的pdf预览组件
  12. 生产排程系统_APS系统(13)装配齐套树形生产订单排程算法
  13. Android基础整合项目之节日群发助手
  14. EfficientPS网络
  15. 华为ensp---AC三层旁挂组网实验(参照华为官方手册)
  16. 企业微信怎么下载资料 企业微信下载资料教程
  17. python输出最大的素数_python-最大素数
  18. 注册申请企业邮箱后如何使用,企业邮箱有已读回执功能吗?
  19. mot文件解析成bin
  20. 使用【阿里云】API接口进行手机号(三网)实名认证

热门文章

  1. PPT绘图相关,快捷键,美观度
  2. window.addventlistener使用方法
  3. python图片分析中央气象台降水量预报_全国天气降水量预报图数据接口
  4. linux 原始套接字 绑定网卡,Linux原始套接字实现分析
  5. 使用原始套接字实现ping操作
  6. DSP28335 Mcbsp SPI实现软件片选
  7. 梨视频:基于阿里云E-MapReduce搭建视频推荐系统的实践
  8. 手把手教你如何从数据入手判断渠道刷量造假作弊
  9. 好佳居软装十大品牌 软装可以让你感受到不同的味道
  10. vivado如何修改工程名称(Project name)