前言

对突如其来的长假感到惶恐和不安?紧盯2019-nCoV的最新消息却依然感觉很空虚?腰酸萎靡脖子僵甚至怀疑自己有点发烧?这是长时间没学习的症状。

很久以前小夕推送的深度学习入门资料推荐和机器学习与数学基础入门系列收到到了很多小伙伴的好评和感谢,也因此一直有呼声希望小夕写一篇NLP方向的入门指导。于是,趁着这个长假,终于将这一篇拖了两年的稿子结了,希望能帮助到大家哦。

入门圣经

一如既往的还是那句话,不要养成囤书却不看书的习惯!!!入门阶段,精读一到两本经典书籍足矣。这里贴出来的书籍小夕在求学阶段都刷过,精读了这里的第1、2和4这三本(第二本由于太厚,到今天还没刷完),粗读了第3本,另外也粗刷了其他一些奇奇怪怪的书籍。

小夕这里吐血推荐前两本,第一本书适合快速入门,第二本书则是修炼内核的圣经书。两本书非常互补,入门阶段足够了。另外也给出了其他两本参考书,有兴趣的小伙伴根据自身精力阅读。

1. neural network methods for natural language processing

豆瓣书评传送门:https://book.douban.com/subject/27032271/

注:订阅号【夕小瑶的卖萌屋】后台回复关键字【NLP入门书】可获取PDF下载链接

2. speech and language processing

豆瓣书评传送门:https://book.douban.com/subject/5373023/

注:订阅号【夕小瑶的卖萌屋】后台回复关键字【NLP入门书】可获取PDF下载链接

3. Foundations of Statistical Natural Language Processing

豆瓣书评传送门:https://book.douban.com/subject/1224802/

注:订阅号【夕小瑶的卖萌屋】后台回复关键字【NLP入门书】可获取PDF下载链接

4. 统计自然语言处理

豆瓣书评传送门:https://book.douban.com/subject/25746399/

进阶打卡

对于已经入门NLP的小伙伴,自然要paper刷起啦!还在自己苦苦搜集最新paper?想知道某个NLP方向的最新进展?贴心的小夕已经为大家准备好啦( ̄∇ ̄)

注:由于每个方向的list都比较长,因此本文只列出每个方向的前五篇文章,每个方向的完整list请通过对应的关键词在订阅号【夕小瑶的卖萌屋】后台领取哦。

pretrain models【预训练模型】

1. HUBERT Untangles BERT to Improve Transfer across NLP Tasks. Anonymous authors. ICLR 2020 under review.

2. ELECTRA: Pre-training Text Encoders as Discriminators Rather Than Generators. Anonymous authors. ICLR 2020 under review.

3. Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer. Colin Raffel, Noam Shazeer, Adam Roberts, Katherine Lee, Sharan Narang, Michael Matena, Yanqi Zhou, Wei Li, Peter J. Liu. Preprint.

4. BART: Denoising Sequence-to-Sequence Pre-training for Natural Language Generation, Translation, and Comprehension. Mike Lewis, Yinhan Liu, Naman Goyal, Marjan Ghazvininejad, Abdelrahman Mohamed, Omer Levy, Ves Stoyanov, Luke Zettlemoyer. Preprint.

5. MultiFiT: Efficient Multi-lingual Language Model Fine-tuning. Julian Eisenschlos, Sebastian Ruder, Piotr Czapla, Marcin Kardas, Sylvain Gugger, Jeremy Howard. EMNLP 2019.

注:完整版最新paper list在后台回复【预训练】领取(持续更新完善ing)

Machine Translation (MT)【机器翻译】

1. Effective adversarial regularization for neural machine translation. Sano, Motoki, Jun Suzuki, and Shun Kiyono. ACL 2019.

2. Robust neural machine translation with doubly adversarial inputs. Cheng, Yong, Lu Jiang, and Wolfgang Macherey. ACL 2019.

3. Learning deep transformer models for machine translation. Wang, Qiang, et al. ACL 2019.

4. Self-Supervised Neural Machine Translation. Ruiter, Dana, Cristina Espana-Bonet, and Josef van Genabith. ACL 2019.

5. Bridging the gap between training and inference for neural machine translation. Zhang, Wen, et al. ACL 2019.

注:完整版最新paper list在后台回复【机器翻译】领取(持续更新完善ing)

Question Answer Systems【问答系统】

1. NumNet: Machine Reading Comprehension with Numerical Reasoning. EMNLP 2019.

2. What's Missing: A Knowledge Gap Guided Approach for Multi-hop Question Answering. EMNLP 2019.

3. BiPaR: A Bilingual Parallel Dataset for Multilingual and Cross-lingual Reading Comprehension Novels. EMNLP 2019

4. Read + Verify: Machine Reading Comprehension with Unanswerable Questions. Minghao Hu, Furu Wei, Yuxing Peng, Zhen Huang, Nan Yang, and Ming Zhou. AAAI 2019.

5. Language Models as Knowledge Bases? EMNLP 2019

注:完整版最新paper list在后台回复【问答系统】领取(持续更新完善ing)

Dialogue Systems 【对话系统】

1. Sarik Ghazarian, Weischedel Ralph, Aram Galstyan, Nanyun Peng. Predictive Engagement: An Efficient Metric for Automatic Evaluation of Open-Domain Dialogue Systems  AAAI 2020.

2. Exploiting Persona Information for Diverse Generation of Conversational Responses. IJCAI, 2019.

3. Global-to-local Memory Pointer Networks for Task-Oriented Dialogue. ICLR, 2019.

4. Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset. 2019

5. Fan Wang Jinhua Peng Hua Wu Rongzhong Lian, Min Xie. Learning to select knowledge for response generation in dialog systems. arXiv preprint arXiv:1902.04911, 2019.

注:完整版最新paper list在后台回复【对话系统】领取(持续更新完善ing)

Data augmentation【数据增强】

1.  Xie Q , Dai Z , Hovy E , et al. Unsupervised Data Augmentation for Consistency Training[J]. 2019. 
2. Ho D , Liang E , Stoica I , et al. Population Based Augmentation: Efficient Learning of Augmentation Policy Schedules[J]. 2019.

3. Cubuk, Ekin D, Zoph, Barret, Mane, Dandelion,等. AutoAugment: Learning Augmentation Policies from Data[J].

4. Kobayashi S . Contextual Augmentation: Data Augmentation by Words with Paradigmatic Relations[J]. 2018.
5. Wang X, Pham H, Dai Z, et al. Switchout: an efficient data augmentation algorithm for neural machine translation[J]. arXiv preprint arXiv:1808.07512, 2018.

注:完整版最新paper list在后台回复【数据增强】领取(持续更新完善ing)

Textual Adversarial Attack and Defense【文本对抗样本与防御】

1. Analysis Methods in Neural Language Processing: A Survey. Yonatan Belinkov, James Glass. TACL 2019.

2. Towards a Robust Deep Neural Network in Text Domain A Survey. Wenqi Wang, Lina Wang, Benxiao Tang, Run Wang, Aoshuang Ye. 2019.

3. Generating Natural Language Adversarial Examples through Probability Weighted Word Saliency. ACL 2019.

4. Universal Adversarial Triggers for Attacking and Analyzing NLP. EMNLP-IJCNLP 2019.

5. LexicalAT: Lexical-Based Adversarial Reinforcement Training for Robust Sentiment 6. Classification. EMNLP-IJCNLP 2019.

注:完整版最新paper list在后台回复【对抗样本】领取(持续更新完善ing)

Graph Neural Networks【图神经网络】

1. A Comprehensive Survey on Graph Neural Networks. arxiv 2019.

2. DyRep: Learning Representations over Dynamic Graphs. ICLR 2019.

3. Hypergraph Neural Networks. AAAI 2019.

4. Graph Neural Networks: A Review of Methods and Applications. arxiv 2018.

5. Self-Attention Graph Pooling. ICML 2019.

注:完整版最新paper list在后台回复【图神经网络】领取(持续更新完善ing)

Style Transfer【文本风格迁移】

1. A Dual Reinforcement Learning Framework for Unsupervised Text Style Transfer. Fuli Luo. IJCAI-2019.

2. Style Transfer in Text: Exploration and Evaluation, Zhenxin Fu from PKU, AAAI-2018.

3. Fighting Offensive Language on Social Media with Unsupervised Text Style Transfer. Cicero Nogueira dos Santos, ACL-2018.

4. Style Transfer from Non-Parallel Text by Cross-Alignment, NIPS-2017, Tianxiao Shen.

5. Unsupervised Text Style Transfer using Language Models as Discriminators, Zichao Yang, Arxiv.

注:完整版最新paper list在后台回复【风格迁移】领取(持续更新完善ing)

Knowledge Graph & Knowledge Representation【知识图谱与知识表示】

1. RSN: Learning to Exploit Long-term Relational Dependencies in Knowledge Graphs. Lingbing Guo, Zequn Sun, Wei Hu. ICML 2019.

2. DihEdral: Relation Embedding with Dihedral Group in Knowledge Graph. Canran Xu, Ruijiang Li. ACL 2019.

3. CapsE:A Capsule Network-based Embedding Model for Knowledge Graph Completion and Search Personalization. Dai Quoc Nguyen, Thanh Vu, Tu Dinh Nguyen, Dat Quoc Nguyen, Dinh Q. Phung. NAACL-HIT 2019.

4. CaRe: Open Knowledge Graph Embeddings Swapnil Gupta, Sreyash Kenkre, Partha Talukdar. EMNLP-IJCNLP 2019.

5. Representation Learning: A Review and New Perspectives. Yoshua Bengio, Aaron Courville, and Pascal Vincent. TPAMI 2013.

注:完整版最新paper list在后台回复【知识图谱】领取(持续更新完善ing)

Information Extraction【信息抽取】

3. FewRel: A Large-Scale Supervised Few-Shot Relation Classification Dataset with State-of-the-Art Evaluation. EMNLP 2018.

4. Hierarchical Relation Extraction with Coarse-to-Fine Grained Attention Xu Han, Pengfei Yu, Zhiyuan Liu, Maosong Sun, Peng Li. EMNLP 2018.

5. RESIDE: Improving Distantly-Supervised Neural Relation Extractionusing Side Information Shikhar Vashishth, Rishabh Joshi, Sai Suman Prayaga, Chiranjib Bhattacharyya, Partha Talukdar. EMNLP 2018.

1. A Survey of Deep Learning Methods for Relation Extraction. Shantanu Kumar. 2017.

2. Relation Extraction : A Survey. Sachin Pawara,b, Girish K. Palshikara, Pushpak Bhattacharyyab. 2017.

注:完整版最新paper list在后台回复【信息抽取】领取(持续更新完善ing)

当然啦,NLP的研究方向远不止这些,像词法分析句法分析语义分析等NLP基础问题,以及信息检索文本摘要篇章理解等重要应用方向暂时没有在这里贴出。后续本文会在订阅号主页下方「知识网络」标签页内持续更新,不断完善和跟进已有方向的paper list,增加新的大方向和小方向,敬请期待哦~

NLP最佳入门与提升路线相关推荐

  1. 【深度学习】新人如何入门Pytorch的路线?有哪些资源推荐?

    初学者如何入门Pytorch,看看过来人的建议 作者:范星.xfanplus 链接:https://www.zhihu.com/question/55720139/answer/294449487 高 ...

  2. 入门无人驾驶学习路线

    入门无人驾驶学习路线 参考资料: 1.如何成为一名合格的自动驾驶工程师 https://blog.csdn.net/u011776903/article/details/94451043 2.从小白到 ...

  3. 刘知远:NLP研究入门之道(三)如何通过文献掌握学术动态

    点击上方,选择星标或置顶,每天给你送干货! 阅读大概需要9分钟 跟随小博主,每天进步一丢丢 作者 刘知远 编辑 zenRRan 地址 https://github.com/zibuyu/researc ...

  4. 我的机器学习入门清单及路线!

    Datawhale干货 作者:桔了个仔,南洋理工大学,Datawhale成员 知乎:https://www.zhihu.com/people/huangzhe 这是我个人的机器学习入门清单及路线,所以 ...

  5. Github标星2.3k+!这个仓库提供了靠谱的入门人工智能的路线及资料!

    本文为AI入门者推荐一个Github仓库,仓库推荐了一个简易的学习路线,并提供了代码和数据集下载. 本文作者:黄海广 一.前言 AI以及机器学习入门,初学者遇到的问题非常多,但最大的问题就是: 资料太 ...

  6. Python入门 Python自学路线 Python如何学习

    本文介绍Python入门 Python自学路线 Python如何学习.先说点题外话吧:首先呢,我刚开始接触编程的时候,学的是C,那时候Python还没有这么火,后来学了C++,PHP,Java,前端. ...

  7. 【机器学习基础】机器学习理论最佳入门!周志华宝箱书搭档,开源教程《钥匙书-KeyBook》发布...

    作者:詹好.Datawhale开源项目组 开源初衷 近年来,多样化的机器学习相关教材和视频层出不穷,不仅包含了入门级机器学习宝典,还包括一些系统性书籍. 但国内在机器学习理论(Machine Lear ...

  8. 首发:适合初学者入门人工智能的路线及资料下载

    本文为AI入门提供了一个简易的学习路线,并提供了代码和数据集下载.(黄海广) 一.前言 AI以及机器学习入门,初学者遇到的问题非常多,但最大的问题就是: 资料太多!!!看不完!!!不知道如何取舍!!! ...

  9. 一些NLP的入门资料参考

    本站整理了一些NLP的入门资料参考,建议初学者看看. 需要复制链接在浏览器里打开. 1.通过kaggle比赛学习机器学习文本分类方法https://zhuanlan.zhihu.com/p/34899 ...

最新文章

  1. 收藏 | 10本免费的机器学习和数据科学书籍(附链接)
  2. Mysql系列七:分库分表技术难题之分布式全局唯一id解决方案
  3. [WorldWind学习]17.视域调度(视域体裁剪)
  4. 如何在nginx中缓存静态文件
  5. 编译其他mysql客户程_mysql编译模块
  6. unity3d 动态合批设置_Unity3D SkinnedMeshRenderer合批优化
  7. Windows编程—控制面板程序显示信息修改(程序图标、名称、链接等)
  8. 苹果系统c语言打开文件夹,MAC系统硬盘文件夹详解
  9. 雪花怎么画_平安夜怎么过?画个圣诞妆,你是最迷人嘎,你知道吗
  10. java 关闭启动日志,求助啊无法启动java了点开就是报错要求查看日志
  11. [CentOS 7] TexLive2017中kpsewhich Bug的修复
  12. git推送代码的命令详解
  13. c/c++ 宏中#和##的用法
  14. 教师要合理使用计算机,教师职称计算机考试题库
  15. 火狐firefox浏览器不能播放视频,但别的浏览器可以。
  16. 国标GB28181协议视频平台EasyGBS国标级联到上级宇视平台,不断切换在线和离线状态是什么原因?
  17. Linux服务器入侵预防与问题排查
  18. 已解决SyntaxError:positional argument follows keyword argument
  19. IDEA SVN拉下来的项目import project 没反应 解决方案
  20. WLAN 无线局域网 基本概念

热门文章

  1. 微信小程序 制作五星评分组件
  2. 字体: 字体平滑,反锯齿,和次像素渲染(收集)
  3. 如何提高自己的自信心
  4. 解决console.log打印对象时出现省略号的情况
  5. 安卓查看内存读写测试软件_苹果危机,iPhone 的流畅度被安卓超越?
  6. 苹果公司前首席执行官乔布斯已经去世
  7. import提示could not be resolved
  8. 基于知乎matisse增强 拍摄视频并压缩
  9. eos源码赏析(十二):EOS之从“狼人游戏”看智能合约调用及权限分配(下)
  10. 锤子宣布调整T1手机价格 降价幅度达千元