雷锋网 AI 科技评论按:正如大家讨论人工智能时经常把它和机器学习甚至深度学习近似等价,工业界和学术界的许多研究、开发人员们也往往过于关注深度学习,忽略了实际上范围更广的机器学习和人工智能领域还有许多有价值的问题等待研究。

近日,UC 伯克利大学电子工程与计算机学院和统计学院教授、机器学习领域的宗师、被称为「人工智能界的迈克尔乔丹的」Michael I. Jordan 就发表了一篇文章,提醒大家不仅深度学习不是「人工智能」的全部,甚至我们日常讨论的「人工智能」都不是真正意义上的「人工智能」的全部;这里不仅有许多我们忽略了的问题,而且为了真正造福全人类,还有一个关于如何构建人工智能系统的新学科才刚刚萌芽、 等待建立。雷锋网 AI 科技评论把这篇文章全文编译如下。

人工智能(AI)是这个时代的人们的口头禅,它被技术专家、学者、记者和投资者们一遍遍反复念叨。就像以往许许多多先从技术学术领域出现再传播到普罗大众中的短语一样,人们使用 AI 这个短语时存在严重的误解。以往可能是因为公众没能理解科学家,但这次是科学家们和公众一样迷惑。这个时代出现和我们具有同等智力的硅基智慧的可能性让我们所有人都觉得有趣,它既吸引我们又让我们害怕。但是,它还会让我们分心。

对于这个时代发生的事情,我想讲一个视角独特的故事。这个故事里涉及到人类、计算机、数据和生死抉择,但这里的重点是硅基智能的幻想之外的一些东西。14 年前,当我的妻子怀孕时,我们做了超声波检查。为她检查的遗传学家指出胎儿心脏周围有一些些白色斑点。「这些是唐氏综合症的标志,」她说,「患病风险已经上升到二十分之一了。」她进一步告诉我们,可以通过羊膜穿刺术检查出胎儿是否带有唐氏综合症突变基因。但是羊膜穿刺术存在风险,在手术过程中胎儿的死亡率大约是三百分之一。

作为一名统计学家,我决定找出这些数字的来源。长话短说,我找到了一份来自英国的 10 年前的针对这一疾病的统计分析,其中认为这些白色的斑点反映了钙的积累,是唐氏综合症的预测因子之一。但我也注意到,检查我妻子的成像机器比英国研究中使用的机器每平方英寸多几百个像素。我就回去告诉遗传学家,这些白色的斑点很可能是假阳性——它们实际上是「白噪音」。她说到,「啊,那我知道为什么我们诊断出的唐氏综合症几年前一下子变多了,我们就是那个时候换的新机器。」

我们最终没有做羊膜穿刺术,几个月后,我们的女儿出生了,非常健康。但这件事让我心中五味陈杂,尤其是在粗略计算之后,我确信,在医生告诉我们诊断结果的那一天,全世界上有成千上万的人得到了与我们相同的诊断结果,他们中的许多人选择了羊膜穿刺术,许多婴儿不必要地死去。这种事情每天都会发生,直到某一天人们找出原因。这一事件体现出的医疗问题并不是只有我一个人会遇到,这是整个医疗系统的问题 —— 在某一些时间地点测量变量、得出结果,进行统计分析,然后在其他时间地点使用这些结论。

准确地说,问题不仅在于数据分析本身,还在于数据库研究人员所称的「溯源(provenance)」—— 广义上说,数据出现在哪里,从数据中得出了什么推论,以及这些推论与当前情况关联性有多大?虽然一个受过专业训练的人可能能够针对每一种情况具体分析、具体解决,但真正需要解决的问题是全世界范围使用的医疗系统如何在不需要精细的人类监督情况下就能做到这一点。

我也是一名计算机科学家,我突然意识到建立这种世界性规模的推理和决策系统的学科 —— 将计算机科学与统计学融合,并将人类经验考虑在内 —— 从来就没有任何学校教授过。我也意识到,不仅在医学领域,在商务、运输和教育等领域也类似,这种法则的建立至少与构建 AI 系统(让我们眼花缭乱的游戏 AI 和运动感知系统)同等重要。

无论我们能否在短时间内理解「智能」,我们都面临着一个巨大的挑战,那就是如何将计算机和人类结合,让人类更好地生存。这一难题被一些人看作是「人工智能」的诞生,但我们也可以用平常心、以敬畏之心把它看作工程学科的一个新的分支。

就像几十年前的土木工程和化学工程一样,这个新学科的目标是集合一些关键思想的力量,安全地为人们带来新的资源和能力。就像土木工程和化学工程是建立在物理理论和化学理论的基础之上,这个新学科建立在我们在上个世纪中发现的思想之上,在诸如「信息」、「算法」、「数据」、「不确定性」、「计算」、「推理」和「优化」等概念之上。此外,由于这一学科的大部分重点都是来自于人类、关于人类的数据,它的发展也需要社会科学和人文学科提供帮助。

虽然这个学科的一些基础理论已经逐渐出现,但把它们组合到一起的法则还不见踪影。这些基础理论之间现在就只能单个单个地产生联系、堆在一起。

就像土木工程学科出现之前人们就已经在造房子、造桥一样,人们现在也是在没有建立起新的学科的情况下,就在着手建造把机器、人类、环境都包含在内的全社会尺度的推理和决策系统。同样地,就像早期的建筑和桥梁有时会以完全无法预料的方式倒塌,造成悲剧的后果,我们许多早期的全社会尺度的推理和决策系统也已经暴露出了严重的观念问题。

更难堪的是,我们人类并不是很擅长预测下一次会在哪里出现严重问题。我们现在缺少它对应的工程学科,缺少其中的分析和设计的法则。

当下的公众谈起这些问题的时候总是用「人工智能」这个词宽泛地囊括了所有和智慧相关的概念,这也就让新出现的科学技术的影响范围和后果变得很难讨论。我们先仔细看看「人工智能」这个词近期以及历史上都表示过哪些含义吧。

如今的「人工智能」在大多数情况下所指的,尤其是在公众讨论中,就是过去的几十年中我们称作「机器学习 Machine Learning」的东西。机器学习是一门研究算法的学科,它从统计学、计算机科学和其它一些学科汲取了思想,用来设计能处理数据、做出预测、帮助人类决策的算法。至于对真实世界的影响,机器学习的影响是实实在在的,而且远不止是近期才有影响。实际上,早在 1990 年代初的时候机器学习就已经表现出了明显的迹象可以对工业界产生巨大的影响,到了二十一世纪,亚马逊这样的有前瞻性的公司就已经把机器学习用到了公司业务的上上下下当中,处理着诈骗检测、逻辑链预测这样的后端问题,也构建了推荐系统这样的面向用户的创新服务。随着数据集的大小和计算资源在过去的 20 年里突飞猛进,我们现在可以清楚地看到,不只是亚马逊,几乎任何可以依据大规模数据做出决策的企业都很快会把机器学习作为动力。新的商业模式会涌现。也已经出现了「数据科学」这个短语用来称呼这种现象,其中反应的就是机器学习算法专家和数据库、分布式系统专家携手构建可拓展的、鲁棒的机器学习系统的需求,也反应了这样的系统对更大的社会和环境范围的影响。

在过去的几年里,这种思想和技术潮流的融合也被我们称作了「人工智能」。然而这种称呼是值得我们仔细审视的。

历史上来说,人们在 50 年代末产生了一股用软硬件共同重现出人类水平智慧的热情,同时也创造出了「人工智能」/「AI」这个词。这种志向我们可以称为仿人类人工智能(human-imitative AI),在这种观念里具有人造智慧的实体应当被看作我们的伙伴,即便看上去不像,精神上也应当像。这很大程度上可以看作学术研究领域的一种野心。一些相关的学术领域当时就已经存在,比如运筹学、统计学、模式识别、信息学和控制学这些学科,而且他们也经常从人类的智慧(以及动物的智慧中)获得启发,但一定程度上这些学科都关注的是“低层次”的信号和决策。比如说一只松鼠理解它所居住的森林的三维结构的能力、在树枝间跳跃的能力,都对这些学科有启发作用。而「人工智能」应当关注的是另一些东西,是人类推理、思考中的「高层次」的、「认知性」的能力。一晃六十年过去了,高层次的推理和思考能力我们仍然捉摸不到。如今被称作人工智能的技术进步基本都来自于低层次模式识别、运动控制相关的工程领域,以及在数据中寻找模式,据此做出预测、验证猜想和决策的统计领域。

实际上,David Rumelhart 在八十年代重新发现的、如今被看作是所谓「人工智能革命」的核心的反向传播算法,最早在五六十年代就出现在了控制领域。当时它最早的应用之一就是为阿波罗飞船计算飞向月球时的推力。

六十年代以来,我们的技术有了许多突破性发展,但是很大程度上这些进步并不是来自于对仿人类人工智能的追求的。倒不如说,就像阿波罗飞船的这个例子里一样,这些思想都是隐藏在幕后的,是尝试解决一些非常具体的工程挑战的研究人员们的研究成果。虽然一般大众看不到,但在文档索引、文本分类、腐败监控、推荐系统、个性化搜索、社交网络分析、规划、诊断和 A/B 测试方面的研究和系统构建都非常的成功;谷歌、Netflix、Facebook、Amazon 这些大公司的驱动力也正是这样的技术进步。

现在我们会简单地把上面这些东西全都统称为「人工智能」,看上去也似乎确实是那么回事。对于优化或者统计领域的研究员来说,这种归类方式算是一个不大不小的惊喜,他们一下子就变成了「人工智能研究员」。但除了研究员的归类问题之外,更大的问题是这种单个的、定义得并不准确的缩写词汇会阻止我们清晰地理解当下大规模的智能化和商业化问题。

过去的 20 年里我们有许多重大突破,工业界和学术界也一同创造出了一种新的思维,作为仿人类人工智能的补充;我们常常把它称作「智慧增强」(Intelligence Augmentation)。在这里,我们用计算能力和数据构建一些服务,它们可以增强人类的智力和创造能力。搜索引擎就可以看作是智慧增强的一个例子,它增强了人类的记忆能力、增强了人类对客观事实的认识;自然语言翻译也是这样,它增强了人类的沟通的能力。基于电脑的声音和图像生成也可以成为艺术家创作时的调色板和创新思想的增强。不过,虽然这样的服务最终不可避免地会涉及到高层级的推理和思维能力,目前它们却在这方面是一篇空白:它们所做的只不过是通过各种各样的字符串匹配和数值计算找到一些人类可以加以利用的模式而已。

这里我还需要再提出一个概念,就是广义地认识到「智慧基础设施」(Intelligent Infrastructure)这个学科。它是指一种计算能力、数据和相关的物理实体组成的网络,这个网络可以让人类的生存环境对人类更有帮助性、更有趣、也更安全。这样的基础设施已经在物流运输、医药、商业和金融这样的领域显露头角,影响到了无数的个人和社会活动。有时候人们谈起物联网(IoT)也会提起某种网络的建立,不过物联网领域的网仅仅是把「物」连接到了「网」上而已,对于如何让这些「物」处理数据流、发现关于世界的信息、与人类互动等等超越 0 和 1 组成的数据的高级抽象问题完全没有触及。

比如我可以再讲一个自己的想法,我们可能幻想过生活在一个「全社会尺度的医疗系统」中,它会设置好医生和病人身边的医疗设备间的数据流和数据分析流,从而在疾病诊断和医疗护理中为人类的智慧提供帮助。这个系统可以收集身体细胞中的信息、DNA 中的信息、血液诊断中的信息、环境、群体遗传学以及关于药物和医疗方法的海量文献中的信息,然后把它们集成在一起。它关注的不是单个病人和医生,而是所有人类之间的关系,就像现代的医学实验是在某一部分人身上(或者动物身上)做实验,然后用依据实验结果医治别的人。同样,就像现代银行系统可以在金融和支付领域中注重关联性、可追溯性和可靠性这些问题一样,这个医疗系统也最好可以注重这些理念。并且,虽然我们可以预见到构建这样的系统会遇到各种各样的问题,包括隐私问题、责任问题、安全问题等等,但这些问题都应当被正确看待为等待解决的挑战,而不是阻止构建这样系统的理由。

我们现在就遇到了这样一个关键问题:面对这些更大的挑战,研究仿人类人工智能是应对它们的最好的方法,甚至是唯一的方法吗?机器学习领域最常被提起的成功故事里有不少就是和仿人类人工智能相关的,比如在计算机视觉、语音识别、游戏 AI 和机器人领域。所以似乎看起来我们就只要等着这样的领域里不断出现新的进步就好了。

在这里我想指出两件事。一,虽然报纸上不会这样讲,但仿人类人工智能方向的研究实际上有很大限制,我们距离达到真正的仿人类人工智能的目标还非常远。不幸的是,仿人类人工智能领域的有限的进步也很容易引发人们的激动(以及恐惧),这让这个方向的研究本身过于火热、媒体关注也过多。任何其它的工程领域都看不到这样的现象。二,而且更重要的是,如果是为了解决重要的智慧增强和智慧基础设施问题,那么仿人类人工智能相关领域的成功既不充分也不必要。

对于充分性这一边,可以想想自动驾驶汽车。为了实现这样的技术,等待解决的一系列工程问题和人类胜任驾驶的程度(以及人类不胜任驾驶的程度)几乎没有任何关系。一个总体性的交通运输系统(一个智慧基础设施)会非常接近现代的空中管制系统,而不太像目前的几乎没有分组的、前向的、漫不经心的人类司机的集合体。它将会比目前的空中管制系统复杂得多,尤其在于它可以利用海量数据和自适应性建模能力,做出细粒度决策。我们最先需要考虑的正是这样的问题,而对于这样的问题,仿人类人工智能方面的努力反倒会分散我们的注意力。

对于必要性,有一些人提出仿人类人工智能的愿望其实包含了智慧增强和智慧基础设施在内,因为仿人类人工智能将不仅可以解决各种经典 AI 问题(字面意思上,比如图灵测试),而且它最有可能同时解决智慧增强和智慧基础设施问题。这样的观点其实找不到什么历史先例作为支撑。土木工程的发展难道靠的是设想如何设计人造的粉刷匠和泥瓦匠吗?难道化学工程的学科框架是如何创造出一个人造化学家?甚至更有意思的是,如果我们的目标是建造一个化学工厂,那我们难道应该要先造出一个人造化学家,然后让它来思考如何建造一个化学工厂?

还有一种有关联的观点,是说人类智能是我们唯一知道的一种智能,我们发展人工智能的第一步就应当是尝试模仿这种智能。但是实际上有一些类型的推理人类并不是很擅长,人类有很多失误、偏见和限制。更重要的是,人类进化的目的就不是为了处理现代智慧基础设施那样的大规模决策问题的,也同样不是为了处理智慧基础设施环境下的不确定性问题的。有的人可能会说,一个人工智能系统将不仅可以模仿人类的智慧,而且还可以「纠正」它,当然也就可以拓展到任何大规模问题上去。但这样的想法就跑到了科幻小说的领域去了,这样的纯粹猜想性的观点当然符合科学幻想,但不应当作为我们面对逐渐显现的重要的智能强化和智慧基础设施问题时的主要策略。我们应当分别以它们应有的方式处理智能强化和智慧基础设施问题,而不是仅仅当作仿人类人工智能目标的推论。

其实不难看到,智慧基础设施系统中的算法和基础设施挑战并不是仿人类人工智能研究中的核心主题。智慧基础设施需要的是管理快速变化的、而且很有可能全局不相干的分布式知识存储的能力。这样的系统需要云计算和边缘计算之间的互动,才能做出即时的、分布式的决策;而且还需要能够处理数据中的长尾现象,即关于某一些个体有很多的数据,但大多数个体都只有很少的数据。它们需要能处理在穿越管理性和竞争性的边界分享数据的问题。最后,而且也非常重要的是,智慧基础设施系统需要把动机和定价这样的经济学理念融入到连接了人与人、人与商品的统计和计算基础设施中。这样的智慧基础设施系统就不仅仅是提供了服务,更重要的是它提供了市场。音乐、文学、新闻等一些领域就非常需要这样的市场,其中的数据分析就可以吧创作者和消费者连接到一起。而这一切也都需要在进化出社会性的、符合道德的、合乎法律的前提之下。

当然了,经典的仿人类人工智能问题也仍然是重要的研究课题。但是,目前的人工智能研究都是借助收集数据、借助部署深度学习基础架构,这些系统所展现出的模仿某一些非常专门的人类技术的能力、同时还无法在解释其中的规律上起到什么帮助的现状,实际上分散了我们的注意力,让我们忽视了经典人工智能中的许多开放性问题。这些问题包括:如何给能够处理自然语言的系统增加意义和推理能力,如何推理和表示因果关系,如何开发出可计算的不确定性的表示方法,以及如何开发出能够形式化并追寻长期目标的系统,等等。这些同样都是仿人类人工智能中的经典目标,但在当下的「人工智能革命热潮」中,我们很容易忘记这些问题都还没有解决。

智能增强也依然是足够关键的,在真实世界状况的抽象推理这件事上,在可见的未来内计算机都不可能达到人类的水平。人类和计算机之间需要构建思考足够深入的沟通方式才能解决我们最紧迫的问题。而且我们也希望用计算机把人类的创造力推向新的高度,而不是用计算机取代人类的创造力(各种意义上的)。

John McCarthy(约翰麦卡锡)在达特茅斯学院时提出了「人工智能」这个词,当时明显是为了把他和 Norbert Wiener(诺伯特维纳)两人的不同的研究目标区分开。Wiener 提出词是「神经机械学」(cybernetics),以表示他对智能系统的憧憬是和运筹学、统计、模式识别、信息论和控制理论紧密相关的。McCarthy 则更看重的是智能和逻辑之间的联系。不过后来发生了有趣的反转,目前正是 Wiener 阐述的智力目标统治了这个领域,但打的却是 McCarthy 的旗号。(目前的现状当然是暂时的;AI 领域的风向转换得比其它领域快得多)

但对我们来说,McCarthy 和 Wiener 两人的历史视角我们都需要超越。

我们需要明白,如今普通大众讨论的这种专注于工业和学术中的很小一部分问题的人工智能,有极大的风险会让我们不再注意到人工智能、智能增强和智慧基础设施的全部范围内的挑战和问题。

这个范围并不仅仅是关于某些关于超人类电脑的科幻梦想以及恐惧的,而更关注的是,随着科学技术在人类的生活中越来越显著、越来越有影响力,人类需要能够理解和控制它。并且,在这种理解和控制中,所有人类都应该发出各自的声音,而不是仅仅在了解技术的人之间进行讨论。狭隘地只关注仿人类人工智能会让很多应当被听到的声音无法听到。

虽然业界公司会继续不断地带来更多技术进步,学术界也要扮演好自己的关键角色。不是仅仅提供一些创新的技术思路就结束,而应该把计算学科、统计学科的研究者和值得倾听的其它学科的研究者联系起来,尤其值得一提的是社会科学、认知科学以及人文学科。

另一方面,虽然人文学科和自然科学学科对我们的前进来说都非常重要,我们也应当牢记我们讨论的内容是关于一个前所未见的尺度和范围的工程项目,是这个社会需要构建一些新的人造物。这些人造物应当建造得符合承诺。我们都不希望在一些帮助医疗的、交通的、商务的系统建造完毕之后才发现它们其实不好使,发现它们其实会减少人类的寿命和幸福感。出于这种理念,正如我刚才强调过的,我们需要一种新的工程学科来引导这种数据向的、学习向的领域。虽然这中想法听起来很不错,但目前我们还无法真正地把它看作一门学科。

更进一步地,我们正在见证新的工程领域的出现,我们应该为此感到高兴。「工程」这个词经常被人们理解得很狭隘,不管是在学术界还是更多语境下,好像都隐喻着冷酷无情的机器、或者是失去人类的控制。但其实一门工程学科可以成为任何我们希望它成为的样子。

现在这个时代,我们真的可以设想一种历史上从未出现过的东西:一个新的以人为中心的工程学科。

我现在没法给这个正在萌发的新学科给出一个名字,但如果「人工智能」/「AI」这个词会作为这个学科的命名的词根的话,我们一定要谨记这个词根的极为有限的实际意义。让我们放宽视野、收起狂热,仔细地观察观察我们面前等待着的挑战吧。

Michael I. Jordan

via Michael I. Jordan,雷锋网 AI 科技评论编译


NLP 解决方案是如何被深度学习改写的?

雷锋网

雷锋网 AI 科技评论按:英特尔人工智能产品事业部,数据科学主任 Yinyin Liu 近日撰写了一篇文章,介绍了深度学习为自然语言处理带来的种种变化。有趣的大趋势是首先产生在 CV 领域的技术也不断用于 NLP,而深度学习解决方案的构建方式也随着时间在进化。雷锋网 AI 科技评论编译把这篇文章如下。

自然语言处理(NLP)是最常见的人工智能的应用方式之一,它通过消费者数字助理、聊天机器人以及财务和法律记录的文本分析等商业应用变得无处不在。随着硬件和软件能力的提升,以及模块化 NLP 组件的发展,Intel 的技术也使得各种各样的 NLP 应用成为可能。

深度学习性能的上升趋势

近年来,许多 NLP 领域的进展都是由深度学习领域的普遍进步驱动的。深度学习拥有了更强大的计算资源,可以运用更大的数据集,并且在神经网络拓扑结构和训练范式方面有所发展。这些深度学习的进步始于推动计算机视觉应用的改进,但是也让自然语言处理领域极大地获益。

在深度学习的网络层方面,为了使得信号和梯度能够更容易地传递到深度神经网络的每一层,残差结构单元(residual layer)、highway 层(全连接的 highway 网络)以及稠密连接(dense connections)结构应运而生。有了这些网络层,目前最先进的计算机视觉技术通过利用深度学习网络的表示能力得以实现。同时,他们也在许多自然语言处理任务上提高了模型的性能。例如,将稠密连接的循环层用于语言模型(Improving Language Modeling using Densely Connected Recurrent Neural Networks,https://arxiv.org/abs/1707.06130)。

有实证研究中比较了卷积层、循环层或者一种结合了这两种思想的时序卷积层的表现,时序卷积层在一系列的语言数据集上取得了目前最好的效果(Convolutional Sequence to Sequence Learning,https://arxiv.org/abs/1705.03122;An Empirical Evaluation of Generic Convolutional and Recurrent Networks for Sequence Modeling,https://arxiv.org/abs/1803.01271)。有这些不同类型的层可供灵活使用,使得开发者能够在处理特定的自然语言处理问题时尝试各种各样的选项。

在深度学习的拓扑结构方面,一个自编码器(auto-encoder)模型可以被改进为一个序列到序列(seq2seq)模型用于处理顺序语言数据。注意力机制(attention mechanism)解决了随着时间的推移,解码网络应该如何对输入的编码做出响应。指针网络(Pointer network),作为注意力模型的一种变体,专门用于在输入序列中寻找词语的位置,它为机器阅读理解和文本摘要提供了一种新的处理机制(Machine Comprehension Using Match-LSTM and Answer Pointer,https://arxiv.org/abs/1608.07905;Get To The Point: Summarization with Pointer-Generator Networks,https://arxiv.org/abs/1704.04368)。通过增加快速权重(fast weights),(Fast Weights to Attend to the Recent Past,https://arxiv.org/abs/1610.06258)短期联想记忆的概念可以和长期序列的学习结合到一起。

在训练范式方面,无监督学习利用训练数据本身和迁移学习技术去构建数据表示,迁移学习可以把学到的将表征用于一个又一个的任务,都是从计算机视觉领域获得启发,推动了自然语言处理技术的进步。

由于这些深度学习模型共用了许多底层的组件,基于深度学习的自然语言处理解决方案可以与计算机视觉和其它人工智能功能的解决方案共用软件和硬件。对于深度学习的通用软件栈的优化也可以为深度学习自然语言处理解决方案的性能带来改善。英特尔的人工智能硬件和软件组合解决方案为这些在英特尔架构的系统上运行的深度学习进展提供了很好的示例。最近,在我们的硬件和对广泛使用的深度学习框架的优化上的工作提供了为在英特尔至强可扩展处理器上运行普遍使用的模型和计算任务优化后的工作性能。英特尔也积极地将他们的这些努力回馈到开放的框架中,这样一来,每个开发者都能很直接地获得这些经验。

为自然语言处理用例构建一个灵活的、模块化的栈

由于基于深度学习的自然语言处理模型通常拥有共用的构建模块(例如:深度学习网络层和深度学习拓扑结构),这让我们在构建自然语言处理用例的基础时拥有了一个全新的视角。一些底层的功能在很多种应用中同时被需要。在一个开放的、灵活的栈中获得基本组件对于解决各种各样的自然语言处理问题是十分恰当的。

相比之下,传统的机器学习或者深度学习的做法都是每一次只考虑某一个特定问题。而如今,由于深度学习社区已经提供了许多有用的基础功能模块,企业中的用户和数据科学家们就可以考虑其它的方面,在学习、构建起基础以后,着眼于如何把它们应用于各种不同的问题。

这种转换的好处主要有这么几点。首先,这些可以复用的组件可以帮助我们逐步构建「结构性资产」。通过重复应用之前已经构建好的东西,我们可以做得更快、评价得更快。其次,这些构建在英特尔的统一软硬件平台上的功能和解决方案可以持续不断地从英特尔未来的开发和改进中受益。另外,用现有的基础设施做实验可以拓展出令人惊喜的新的解决方案或者新的应用,这是更早时候的仅关注于问题本身的思考方式所无法带来的。

一个灵活的、模块化的栈还能使用户可以将传统的自然语言处理方法和基于深度学习的方法结合起来,并为不同的用户群提供不同层次的抽象。许多不同的企业用例表明了自然语言处理和它的基本组件的潜力。下面,我们为您提供了几个例子,但是显然还有很多别的可能性。

主题分析

金融业面临着巨大的知识管理挑战,这是由每天必须处理和理解的文件的数量(太大)所造成的。从一页又一页的文本中提取出诸如「某种特定产品的竞争力」这样的关键的见解是十分困难的。

自然语言处理主题分析技术现在可以被用来快速分析大量的文档,并且识别文档中不同的部分所关联的主题。不同的用户会关注不同的话题,例如:某个公司的价值、竞争力、领导力或者宏观经济学。自然语言处理主题分析让用户能够筛选出特定的感兴趣的主题,并且获得更加浓缩的信息。

为了利用大量未标记的数据,模型可以用内容类似的文本进行预训练,之后这些数据表示可以被迁移至主题分析或者其它附加的任务中。早前的一篇博客介绍了这种解决方案中涉及到的一些方法的概述。为了实现这种方案,从自然语言处理构建模块的角度来说,我们使用了序列到序列(seq2seq)的拓扑结构,长短期记忆网络(LSTM),词嵌入来自迁移学习,而后进行精细调节(fine-tune),还可以与命名实体识别等组件结合在一起。

趋势分析

诸如医疗保健、工业制造、金融业等行业都面临着从大量的文本数据中识别基于时间的趋势的挑战。通过将文本正则化、名词短语分块和抽取、语言模型、语料库的词频-逆文本频率指数(TF-IDF)算法,以及使用词向量的分组等技术,我们可以快速的生成一个解决方案,它可以从一组文档中抽取关键词和重要性估计。接着,随着时间的推移,通过比较这些抽取出来的关键词,我们能够发现有用的趋势,例如:天气变化如何能够造成库存的短缺,或者哪些领域的学术研究随着时间的推移会吸引更多的贡献和注意。

情感分析

情感分析功能通常被用于竞争力分析、沟通策略优化、以及产品或市场分析。一个提供了细粒度的情感分析的解决方案能够为企业用户提供可行的见解。例如:这种更有针对性的情感分析可以发现,关于一个特定商品的评论普遍是对于它的能耗的正面看法以及对它的可靠性的负面看法。对于这种细粒度的情感分析,我们使用了诸如词性标注(POS tagging)、文本正则化、依存分析和词汇扩展等组件。对于不同的领域,相同的的那次可能传递不同的情感,所以允许领域自适应的机制也是十分关键的。

多功能体系架构上灵活的构造模块

当我们看到巨大的自然语言处理市场中的种种规划时,我们应该如何构建解决方案、软件、硬件来利用这些机会并使它们成为可能?在英特尔,我们希望构建能够持续创新和改进的技术,这能够给我们一个用于研究、实践并应用算法的开放的、灵活的平台,这种技术还能够高效地扩展到多种应用程序中,最终形成影响深远的商业见解。

在英特尔人工智能实验室,我们的自然语言处理研究人员和开发者正在构建一个开放的、灵活的自然语言处理组件库,以便为我们的合作伙伴和客户实现多种自然语言处理用例。它使我们能够高效地将我们灵活、可靠高性能的英特尔架构为这些自然语言处理应用、其他的人工智能和先进分析工作流提供了硬件、框架工具和软件层。我们将继续努力优化这些组件,以提高深度学习的能力。

via Intel AI Blog,雷锋网 AI 科技评论编译

https://blog.csdn.net/np4rHI455vg29y2/article/details/80140980

【深度学习】不要被深度学习一叶障目不见泰山;NLP 解决方案是如何被深度学习改写的?相关推荐

  1. NLP 解决方案是如何被深度学习改写的?

    作者:杨晓凡 摘要:英特尔人工智能产品事业部,数据科学主任 Yinyin Liu 近日撰写了一篇文章,介绍了深度学习为自然语言处理带来的种种变化.有趣的大趋势是首先产生在 CV 领域的技术也不断用于  ...

  2. 一文弄懂元学习 (Meta Learing)(附代码实战)《繁凡的深度学习笔记》第 15 章 元学习详解 (上)万字中文综述

    <繁凡的深度学习笔记>第 15 章 元学习详解 (上)万字中文综述(DL笔记整理系列) 3043331995@qq.com https://fanfansann.blog.csdn.net ...

  3. 2021-01-24过去十年十大AI研究热点,分别为深度神经网络、特征抽取、图像分类、目标检测、语义分割、表示学习、生成对抗网络、语义网络、协同过滤和机器翻译。

    专利申请量全球第一!清华人工智能发展报告:国内215所高校成立相关本科专业 发布时间:01-2415:20万象大会年度获奖创作者,东方财富网官方帐号 1月20日,清华大学人工智能研究院.清华-中国工程 ...

  4. 万字深度好文!视觉-语言(VL)智能:任务、表征学习和大型模型

    来源:AI科技评论 编译:Jocelyn 编辑:陈彩娴 本文对视觉-语言(VL)智能按时间顺序进行了全面调研,并将这一领域的发展总结为三个阶段: 第一个阶段是2014-2018年,其间,专门的模型被设 ...

  5. 深度学习在工业推荐如何work?Netflix这篇论文「深度学习推荐系统Netflix案例分析」阐述DL在RS的优劣与经验教训...

    来源:专知 深度学习在推荐系统中如何发挥作用是一个重要的问题.最近来自Netflix的文章详细阐述了这一点指出:在建模用户物品交互方面,深度学习相比传统基线方法并无太大优势,而对于异质特征的表示融入深 ...

  6. 谷歌新 AI 实验室主管 Hugo 深度学习教程:神经网络、CV、NLP 难点解析

     谷歌新 AI 实验室主管 Hugo 深度学习教程:神经网络.CV.NLP 难点解析 [日期:2016-12-16] 来源:新智元  作者: [字体:大 中 小]  11月22日,谷歌在蒙特利尔的 ...

  7. 深度学习在美团点评推荐平台排序中的应用 widedeep推荐系统模型--学习笔记

    gbdt+lr的模型之前是知道怎么搞的,dnn+lr的模型也是知道的,但是都没有试验过 深度学习在美团点评推荐平台排序中的运用 原创 2017-07-28 潘晖 美团点评技术团队 美团点评作为国内最大 ...

  8. 真·干货!这套深度学习教程整理走红,从理论到实践的带你系统学习 | 资源...

    铜灵 发自 凹非寺 量子位 出品 | 公众号 QbitAI 寒假/春节小长假给自己充电的真·干货来了. 如果你想要的是一份从理论到实践的深度学习教程清单,如果你想系统了解各类框架.基础网络与各种使用场 ...

  9. 深度神经网络之Keras(三)——正则化、超参数调优和学习方向

    深度神经网络之Keras(三)--正则化.超参数调优和学习方向 本文将继续探索Keras框架下的深度神经网络知识,主要介绍了利用Keras构建的深度神经网络正则化及超参数调优问题. 目录 深度神经网络 ...

最新文章

  1. Monkey与MonkeyRunner之间的区别
  2. 四张图揭秘中国AI人才现状
  3. oracle存储过程实现根据已有数据批量更新另一批数据
  4. MVC2中Area的路由注册实现
  5. 【CodeForces - 1152C 】Neko does Maths(数学数论,lcm,gcd性质)
  6. JavaScript性能优化【下】--性能优化的具体方式
  7. Linux下python执行Killed
  8. 基于matlab的信号与系统课程设计,信号与系统课程设计基于 MATLAB 完成信号与系统综合设计实验...
  9. 超全树叶 叶子免抠元素素材网站整理
  10. 可“一键”轻松激活Office 2010系列“VOL”版本的又一款迷你“KMS服务器”
  11. 如何解决电脑时间同步出错?
  12. 混合非线性整数规划matlab,非线性整数规划matlab
  13. 教你10分钟电脑配置挑选装机速成攻略
  14. 34岁测试工程师面试美团遭拒:只招30岁以下,能加班但工资要求不高的....
  15. 清理Maven仓库冗余文件(lastUpdated、m2e-lastUpdated.properties、空文件夹)脚本
  16. QTcpServer 服务器监听失败
  17. python : folium
  18. 【Dash搭建可视化网站】项目4: 利用Dash Plotly实现数据图表可视化
  19. freebsd的swatch安装和使用
  20. 输入一个URL之后到页面加载的整个过程分析

热门文章

  1. 酷炫背景粒子插件particles.js星空背景使用示例源码 - 附演示及下载地址
  2. 【揭秘】50K+验证工程师求职加分项——MCU芯片验证
  3. 《Cisco QoS认证考试指南(第2版)》——第6章流量限速和整形
  4. VC++使用事务来写SQLite3数据库
  5. ABB DSD系列DSDP170、DSDX404、DSDX452、DSDP140B、DSDO115A、DSDX453、DSDP150、DSDP140A
  6. 微信扫码登录网站实现案例(无需授权)
  7. 《缠中说禅108课》77:一些概念的再分辨
  8. 为什么直接使用IP地址无法访问网站
  9. 移动互联网发展的三大趋势
  10. SFKP • 计算机百科丨云计算发展风云