2019 年 12 月8 日-14 日,机器学习领域国际顶级会议 NeurIPS 2019于加拿大温哥华拉开帷幕。此次大会共吸引了全球1万余名专家学者共赴盛会。本年度,自然语言处理领域在深度学习浪潮下取得了显著成就,成为大会重要议题之一。

百度举办了自然语言处理专题研讨会,百度技术委员会主席、自然语言处理首席科学家吴华博士以及多名研究员和工程师,向现场参会者全面介绍了百度在这一领域的长期积累与全新突破。基于具有完全自主知识产权的飞桨平台,百度自然语言处理在语义计算、阅读理解、多轮对话、机器翻译、开放平台与数据等方向均取得了突破性进展,并进行了大规模产业化应用。雷锋网。

百度技术委员会主席、自然语言处理首席科学家吴华

预训练方面,百度提出知识增强的语义表示模型 ERNIE及持续学习语义理解框架 ERNIE 2.0,在共计 16 个中英文任务上超越 BERT、XLNET,取得了 SOTA 的效果。11月,百度发布基于ERNIE的语义理解开发套件。从原理、应用到开源及平台化,百度在NLP预训练领域进行了极具价值的创新及实践。

机器阅读理解,已成为评估机器语言理解能力的重要方式,也是搜索引擎和对话系统等行业应用中的关键技术。百度建设及发布了最大规模的中文阅读理解数据集DuReader;在泛化方面提出训练框架D-NET,从多模型融合、多任务学习的角度提升模型的泛化能力;

对于对抗样本的攻击,提出了一种面向阅读理解的对抗训练方法;提出文本表示和知识表示的融合模型KT-NET,以解决需要外部知识和常识的问题。其中具有高鲁棒性和迁移能力的阅读理解模型在今年MRQA 阅读理解评测中夺得冠军。

对话方面,提出了基于深度注意网络的多轮响应选择匹配模型 DAM(Deep Attention Matching Network),显著提高了口语理解能力。 在对话系统框架中,百度一方面提供了可编程的对话管理框架,并内置了多个常用标准对话范式,为在云端开发灵活可变的业务对话逻辑提供了便利。另一方面,提供了需求分发和全局记忆机制,支持多个对话任务的集成与联动,提高了对话技能的可复用性,降低了新业务的重复开发成本。 百度可定制对话技术依托百度大脑 UNIT 3.0 平台,支持 5 万多个对话技能,广泛应用于行业客户。

机器翻译领域,百度相继提出了多任务学习、多智能体联合训练等前沿方法,并在2019年国际权威WMT评测中取得中英翻译第一。机器同声传译方面百度走在领域前沿,提出了首个具有预测和可控时延的同传模型,首个语义单元驱动的上下文同传模型,并研发了业内首个语音到语音的同传系统,为用户提供高质量、低时延的同传体验。值得一提的是,基于在此领域取得的进步,由百度主导,联合Google、Facebook、Upenn、清华等海内外顶尖企业及高校共同组织首届机器同传研讨会,将在本领域顶级会议ACL 2020召开,并将举办国际首届同传评测,以进一步促进技术发展。此外,百度还将在领域权威会议EMNLP 2020中举办机器同传tutorial,就机器同传的原理、方法、前沿进展进行讲座。

百度自然语言处理领域产出的卓越成果背后所运用的底层框架,是自研的开源深度学习平台百度飞桨。近两年来,飞桨围绕深度学习框架的基本功能、性能、芯片支持的完备性等技术指标进行了一系列的易用性开发和性能迭代,为开发者提供了优于其他深度学习框架的使用体验。在开发能力方面,飞桨除了支持对常用API的调用之外,还在编程范式上同时支持声明式编程和命令式编程,兼具很好的灵活性和稳定性,可满足不同开发者的开发习惯,更易上手。在训练方面,飞桨平台突破了超大规模深度学习模型训练技术,研制了千亿特征、万亿参数、数百节点的开源大规模训练平台,实现了万亿规模参数深度学习模型的实时更新。在自然语言处理领域,PADDLE-NLP提供了面向6类任务下的30+算法模型,包括上述工作中ERNIE、D-NET等多个国际竞赛的冠军模型。

论文方面,本届会议计收到6743篇论文投稿,两年时间翻了一番,再次创下新纪录。其中1428篇论文入选,入选率仅21.1%。百度共有8篇论文被收录,覆盖量化压缩、对抗训练等诸多前沿方向。

竞赛方面,在NeurIPS 2019: Learn to Move 强化学习赛事中百度再度蝉联冠军,并受邀在Deep RL workshop中进行专题报告。本次比赛的难度非常大,在参赛的近 300 支队伍中,仅有 3 支队伍完成了最后挑战。百度基于飞桨的强化学习框架 PARL 不仅成功完成挑战,还大幅领先第二名(1490 vs 1346)。除了在Best Performance Track获得了第一,相关技术论文也在该赛事的Machine Learning Track中获得了Best Paper Reward.

这些无不显示着百度在NLP领域的技术积累与国际影响力。除了密集的学术交流讨论、报告之外,NeurIPS 2019的百度展台,也吸引了世界各地的参会者。深度学习平台飞桨获得广泛关注,众多参会者到展台咨询使用及合作事宜;百度AI同传吸引了来自美国、俄罗斯、日本、加拿大等世界各国的参与者们纷纷体验。

从专题研讨、论文分享、竞赛报告到多样的现场系统演示,百度在今年的NeurIPS 2019上深度参与,全面展现了百度的前沿技术进展。以百度为代表的中国AI企业的频频身影,已成为国际人工智能学术顶会中的“新常态”。

深度学习浪潮下的自然语言处理,百度NeurIPS 2019展现领域新突破相关推荐

  1. 运用深度学习教机器人理解自然语言

    运用深度学习教机器人理解自然语言 2016-08-16 16:33 转载 CSDN 1条评论 雷锋网按:本文作者Jonathan是21CT的首席科学家.他主要研究机器学习和人工智能如何使用在文本和知识 ...

  2. 深度学习机器学习面试题——自然语言处理NLP,transformer,BERT,RNN,LSTM

    深度学习机器学习面试题--自然语言处理NLP,transformer,BERT,RNN,LSTM 提示:互联网大厂常考的深度学习基础知识 LSTM与Transformer的区别 讲一下Bert原理,B ...

  3. 人脸检测发展:从VJ到深度学习(下)

    人脸检测发展:从VJ到深度学习(下) 2016-08-11 16:36 转载 深度学习大讲堂 0条评论 雷锋网按:本文作者邬书哲, 中科院计算所智能信息处理重点实验室VIPL课题组博士生,研究方向:目 ...

  4. Competition——ML/DL:机器学习、深度学习各种计算机视觉、自然语言处理、科学预测等等比赛竞赛简介

    Competition--ML/DL:机器学习.深度学习各种计算机视觉.自然语言处理.科学预测等等比赛竞赛简介 相关内容 Competition--互联网比赛(编程相关):国内外各种互联网比赛举办时间 ...

  5. 3年半巨亏242亿!商汤高估了深度学习,下错了棋?

    转自:新智元 三年半研发开支近70亿,累计亏损242亿. AI这门生意好像越来越不好做了. 近日,商汤科技已向港交所递交IPO申请.招股书显示,商汤近三年半累计扣非净亏损242亿元. 有网友便提出疑问 ...

  6. 深度学习框架下群组行为识别算法综述

    源自:电子学报       作者:邓海刚  王传旭  李成伟  林晓萌 摘 要 群组行为识别目前是计算机视觉领域的一个研究热点,在智能安防监控.社会角色理解和体育运动视频分析等方面具有广泛的应用价值. ...

  7. Nikolai Yakovenko大佬:深度学习的下一个热点:生成对抗网络(GANs)将改变世界

    生成式对抗网络-简称GANs-将成为深度学习的下一个热点,它将改变我们认知世界的方式. 准确来讲,对抗式训练为指导人工智能完成复杂任务提供了一个全新的思路,某种意义上他们(人工智能)将学习如何成为一个 ...

  8. 深度学习的下一个热点——GANs将改变世界

    本文作者 Nikolai Yakovenko 毕业于哥伦比亚大学,目前是 Google 的工程师,致力于构建人工智能系统,专注于语言处理.文本分类.解析与生成. 生成式对抗网络-简称GANs-将成为深 ...

  9. 深度学习的下一个热点:生成对抗网络(GANs)将改变世界

    本文作者 Nikolai Yakovenko 毕业于哥伦比亚大学,目前是 Google 的工程师,致力于构建人工智能系统,专注于语言处理.文本分类.解析与生成. 生成式对抗网络-简称GANs-将成为深 ...

最新文章

  1. 最新|全球药企15强(附名单)
  2. == Equals ReferenceEquals 的区别
  3. asp(javascript)中request.form(a).count 在ie6中总是为0
  4. ORACLE使用GV_$TEMP_SPACE_HEADER统计临时表空使用情况不准确的问题
  5. idea编辑springboot,如何打成war包
  6. android 启动器开发,Android启动器(Launcher)开发详解
  7. 深度学习(3)手写数字识别问题
  8. 初尝微信小程序2-基本框架
  9. 【leetcode困难】968. 监控二叉树
  10. [转]我们都是花栗鼠
  11. 解决CSDN免登陆复制问题
  12. 使用C#解压缩文件,缺失ZipArchive类
  13. 《麦肯锡方法》第7章 进行研究-思维导图
  14. vue 文件名乱码_如何解决vue.js中文乱码问题
  15. 渗透工具TotalPass:TotalPass 是一款默认口令/弱口令扫描工具
  16. 官方AWZ爱伪装 一键新机 全息备份 虚拟定位 非NZT 暗王者 IG V8 V3 IOSAPP一键新机 全息备份
  17. 每个前端工程师都应该了解的图片知识
  18. utools:比everything更好用的集成工具
  19. kali虚拟机-----破解wifi密码(WiFi渗透)
  20. 微信小程序 微信小程序地图搜索、地图搜索点点击出callout气泡标题说明

热门文章

  1. Anaconda查看、删除、增加channel
  2. udacity 项目同学解决方案
  3. 智源研究院发布《2020北京人工智能发展报告》,剖析北京AI发展的17个中国“第一”...
  4. 量子纠缠真的很怪异吗?
  5. PyTorch基础入门五:PyTorch搭建多层全连接神经网络实现MNIST手写数字识别分类
  6. 机器学习中对抗性攻击的介绍和示例
  7. 15篇「ICCV2021 Oral」最新论文抢先看!看当下计算机视觉在研究什么?
  8. 汪星人出门也靠脸?狗脸识别技术可识别化妆后的汪星人,准确率99%
  9. 规则就够用?还是必须上机器学习?46页ppt教你如何把规则引擎和机器学习融会贯通...
  10. 践行RONG理念,2018年清华数据院科研成果一隅