阅读大概需要5分钟

跟随小博主,每天进步一丢丢

7.25号的时候,陪余南师兄去参加了COLING2018预讲会中科院自动化所现场。

知己知彼,百战不殆。想要发出顶级会议论文,还是得分析当今潮流。所以今天给大家分享下特邀嘉宾张家俊(今年COLING领域主席)开场:从COLING2018看计算语言学进展 报告。

COLING 中国力量

COLING:International Conference on Computational Linguistic,国际计算语言大会。

2008年  20篇accepted(180 accepted,24% accepted rate)

中国占比1/6,而今非昔比:

2018年  100篇accepted (331 accepted,37% accepted rate)

中国占比近1/3!可以看出咱们在AI方向前进之快,虽然没说质量如何,但是数量起来了之后,质量肯定随之而来。

review 有所不同

为了更加公平公正,今年的COLING做了以下变化:

1.在领域主席视角,会隐藏论文作者。

这样会避免因为你是很著名的人而给的心理分,而非客观分数。

2.reviewer看不到其他reviewers的评价。

当然目的是不受其他因素影响。

热点和趋势

COLING2018 vs COLING2016

        

可以看出COLING2018的趋势已经变为神经网络为主。小道消息:今年好像涉及到GAN,半监督学习,强化学习会更容易接受!哈哈,当然,我们不能以发论文而发论文,只是了解下即可。

而拿COLING2018和ACL2018、NAACL2018顶会相比,有以下异同点:

  1. 目前所有自然语言处理和计算语言学会议几乎存在相同的热点和趋势:神经网络、注意机制、表示学习,语义和知识等。

  2. 区别于北美基因的ACL和NAACL,欧洲基因为COLING更加关注语言规律和模型的分析。

代表领域分析

语义表示

对比分析

  1. 语义表示收到了越来越多的关注,对比2018和2016,11->17上升了50%。

  2. 深度学习方法占主导地位

  3. 随着语义表示模型的发展,更多的工作开始关注融合多种信息的、任务或领域特异的、跨语言的、语义消歧的表示学习方法。

  4. 在各顶会(COLING2018和ACL2018、NAACL2018)占比基本相当。

  5. 顶会(COLING2018和ACL2018、NAACL2018)在语义表示领域内容基本一致。

热点和趋势

  1. 融合多种信息的、任务或领域特异的、跨语言的、语义消歧的表示学习方法成为热点。

  2. 由于句子在大部分自然语言处理任务中占据更重要的作用,通用的句子表示学习收到了越来越多的关注。

  3. 随着语义表示框架的逐渐完善,很多工作开始关注如何分析与理解模型的工作机制和评价编码语义的能力。

机器翻译

对比分析

  1. 机器翻译一直是COLING的一个热点,文章数量的占比一直都很大(23/337 vs 23/331)

  2. 神经网络机器翻译的兴起,使得统计学习相关研究大幅度下降(5 vs 1),而神经网络相关研究大幅度提升(4 vs 11)。

  3. 机器翻译在这三个顶会占比基本相当。

  4. COLING更注重语言学知识(比如篇章,句法)在机器翻译中的应用。而ACL和NAACL设计范围更广,包括多模态翻译(图像,语音等)。

热点和趋势

  1. 从模态结构来说,机器翻译领域的baseline,有从RNN-based NMT到Transformer转换的趋势,并且如何改善解码效果也是学术界和工业界一直关注的问题。

  2. 从研究领域来说,稳当翻译多模态翻译(图像翻译,语音翻译),低资源多语言翻译或许继续是未来的热点。

  3. 从机器翻译的角度来看,有些语言的不可解释性依然是个大问题,但也是未来的研究方向。

人机对话

对比分析

  1. 对话领域受到越来越多的关注,文章数量有较大的提升,探讨的主题也越来越丰富

  2. 对话领域和模式识别的其他领域(例如情感,多模态)也逐渐受到了人们的关注。

  3. 对话领域中,聊天系统比重最大。

  4. 对话系统在不同的会议中,比重依然是最大的。

  5. 任务型对话系统在ACL系列中关注度比COLING高。

  6. COLING和NAACL更加偏重于数据构建的工作,而ACL则少见。

热点与趋势

  1. seq2seq是对话系统中常用的方法。

  2. 最热的是构建闲聊系统。

  3. 对话领域和其他领域的结合是未来的趋势。

自动摘要

对比分析

  1. COLING中摘要的比重增加50%(18/331 vs 12/337)

  2. 越来越多的工作面向领域中特定型摘要,eg:Product Summarization,Review Summarization。

  3. 生成式摘要远比16年要高,这得益于端到端的模型在摘要领域的成功。

  4. 相比于ACL2018和NAACL2018,Sentence Summarization只出现在COLING2018,而那两个会议的重点则在于抽取型和生成型结合。

  5. 多文本摘要只出现在COLING2018上。COLING的工作偏向于传统工作。

情感分析

包括很多细方向:

Classification,Transfer,Aspect,Resource,Emotion,Summarization,Dialog,Spam and Others。

对比分析

  1. COLING内的相关文章越来越多(21/337 vs 25/331)

  2. 传统分类的文章则越来越少,说明这个领域的越来越成熟,可研究的方向不多。

  3. 其他类别的文章(如 Aspect,Resource,Emotion)越来越多。

  4. COLING2018有关情感的文章相比于NAACL2018和ACL2018多。

  5. COLING2018 Resource文章8篇,而其他两会没有,那么大概可以说明资源型文章更加偏向于COLING。

  6. ACL2018和NAACL2018 Others方面的文章有4篇和2篇(COLING2018没有),可以看出ACL和NAACL是偏向于新颖的研究的。

多模态信息处理

即Multi-model,包括:

Multi-model text classification(多模态文本分类)

Multi-model sentiment analysis (多模态情感分类)

Image/video captioning (图片/视频标题生成)

Social media information processing (社交媒体信息处理)

Multi-model sementics (多模态语义表示)

对比分析

  1. 多模态领域是COLING的一个崭新的领域,文章数量较少(2016无,2018有3篇)

  2. 社交媒体是多模态的一个重要来源,利用多模态数据增强数据语义表示将会是一个有趣的课题。

  3. 多模态在COLING2018文章较少,在NAACL2018和ACL2018较多,关注度较广,但仍然没有得到研究者的广泛关注。

最后一些话

以上是今年COLING2018预讲会上开场ppt的内容,因为用手机拍摄的,所以有些图片没拍上,但是也不影响大雅,最后希望能帮到在论文迷茫的你!嘿嘿。与你们共勉,一起发顶会论文(说这样的话,我有点慌O.O)

IELTS a bit

assent vi. 同意;赞成

n. 同意;赞成

be adept at v. 擅长

landmark n. 地标;界标;里程碑;纪念碑;划时代的事

adj. 有重大意义或影响的

utterly adv. 完全地;绝对地;彻底地

confidential adj. 机密的;表示信任的;获信任的

推荐阅读:

一大批历史精彩文章啦

【收藏版】长文详解基于并行计算的条件随机场

【珍藏版】长文详解python正则表达式

这些神经网络调参细节,你都了解了吗

谈谈我在自然语言处理入门的一些个人拙见

大数定律和中心极限定理的区别和联系

深度学习之卷积神经网络CNN理论与实践详解

深度学习之RNN、LSTM及正向反向传播原理

TreeLSTM Sentiment Classification

基于attention的seq2seq机器翻译实践详解

【干货】基于注意力机制的seq2seq网络


欢迎关注深度学习自然语言处理公众号,我会每天更新自己在机器学习深度学习NLPlinuxpython以及各种数学知识学习的一点一滴!再小的人也有自己的品牌!期待和你一起进步!

长按识别二维码

点个赞呗

今天谈谈COLING2018计算语言学进展相关推荐

  1. 推荐一位零基础学 NLP 的大佬,内含成长历程

    大佬介绍 大佬:笔名zenRRan,方向自然语言处理,方法主要是深度学习. 未来的目标:人工智能之自然语言处理博士. 写公众号目的:将知识变成开源,让每个渴求知识而难以入门人工智能的小白以及想进阶的小 ...

  2. 一份从入门到精通NLP的完整指南 | NLPer

    该小博主介绍 本人:笔名zenRRan,方向自然语言处理,方法主要是深度学习. 未来的目标:人工智能之自然语言处理博士. 写公众号目的:将知识变成开源,让每个渴求知识而难以入门人工智能的小白以及想进阶 ...

  3. 汉语自动分词研究评述

     汉语自动分词研究评述 [作者]孙茂松/邹嘉彦 [作者简介]孙茂松,清华大学     邹嘉彦,香港城市大学     孙茂松,100084 北京.清华大学计算机系 Email:lkc-dcs@mail. ...

  4. 本科进了大厂拿高薪,为什么硕士和博士却要挤破头进高校?

    点击"开发者技术前线",选择"星标????" 让一部分开发者看到未来 高赞回答一 作者:NYC-2009 夫妻都是985的副教授. 2019年度国家个人所得税的 ...

  5. 本科,硕士们进了BAT拿高工资,为什么博士却要挤破头低薪进985高校?

    点击"开发者技术前线",选择"星标????" 让一部分开发者看到未来 来源:知乎 编辑:学子 只看工资找工作,再好的职业也有可能会被瞧不起的. 高赞回答一 @N ...

  6. 同样的实验室,硕士们进了BAT拿高工资,为什么博士却要挤破头进985高校?

    本文来源知乎 高赞回答一 作者:NYC-2009 夫妻都是985的副教授. 2019年度国家个人所得税的系统里面的税前是270k过一点(老婆是230k的样子,年底津贴比我少).但是我们只是985高校食 ...

  7. 同一个实验室,硕士们进了大厂拿高薪,为什么博士却要挤破头进高校?

    文来源知乎 高赞回答一 作者:NYC-2009 夫妻都是985的副教授. 2019年度国家个人所得税的系统里面的税前是270k过一点(老婆是230k的样子,年底津贴比我少).但是我们只是985高校食里 ...

  8. 为什么同门硕士进了BAT拿高工资,而博士却要挤破头进985高校?

    点击上方"视学算法",选择"星标" 干货第一时间送达 本文来源知乎 高赞回答一 作者:NYC-2009 夫妻都是985的副教授. 2019年度国家个人所得税的系 ...

  9. 985 大学老师的工资并没有很高,为什么大家都挤破头想进高校?

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达本文整理自知乎问答,仅用于学术分享,著作权归作者所有.如有侵权,请联系后台作删文处理. 观点一 作者|N ...

  10. 《现代汉语语法信息词典》的开发与应用

    [摘要]现代汉语语法信息词典是为计算机实现汉语句子的自动分析与自动生成开发的一部机器词典,它以数据库文件形式收录了5万多条现代汉语的词语,不仅给出了每个词语所属的词类,而且详细描述了它们的各种语法属性 ...

最新文章

  1. python 生成001开始的序号_你知道嘛:Python内建序列通用操作有6种实现方法(赶快收藏)...
  2. SAP HR模块的基础数据表和增强配置
  3. pdf转换成word教程
  4. 你有进一步深入理解二分查找吗?
  5. Moreau Decomposition 和 共轭次梯度定理
  6. tm8211的i2s协议
  7. 【NLP】句法分析学习笔记(一)
  8. Xcelsius 2008 在win10 64位系统下 基于OFFICE2010-x64 的安装
  9. 计算机基础知识文件的复制移动,如何复制文件
  10. android模拟器华为账号,夜神模拟器怎么玩华为账号游戏
  11. 年货来咯:精选年度最受欢迎干货,覆盖客户端、服务端、前端、数据、算法……...
  12. 硬核照片显示,魔方即视感
  13. 用Python对PDF去水印(终极版)原则上所有水印都可去除(Pdftron)
  14. component: resolve = require(['../pages/home.vue'], resolve),
  15. JVM-SandBox使用入门
  16. 安卓实现循环定时响铃
  17. 用Swift搭建API Server,Vapor + PostgreSQL + Docker + ECS + OSS
  18. 前端页面性能优化指标
  19. YOLOV5-网络结构和组件(部分代码解析)
  20. Java Swing的打砖块游戏 完整源码 下载直接运行

热门文章

  1. eclipse 使用maven 创建springmvc + mybatis
  2. 用exp无法导出空表解决方法/用exp导出数据时表丢失原因
  3. WebSphere报错指南
  4. MVVM前后分离轻量级框架应用juicer和doT.js
  5. poj 1269 Intersecting Lines
  6. 安装MATLAB(已经下载安装包)
  7. 利用ant脚本 自动构建svn增量/全量 系统程序升级包
  8. php session 设置无效
  9. Webpack——样式处理
  10. orangepi香橙派安装VNC Viewer远程桌面