在入门的阶段最适合做的事情:

(1)阅读和学习自然语言处理(natural language processing,nlp)综述类文章和图书,对nlp有一个基本的认识梳理nlp研究内容的演变,包括nlp从诞生到多次繁荣发展和多次停滞不前的原因,正确认识nlp与人工智能、机器学习、自然语言理解、计算语言学、文本挖掘等概念之间的区别与联系(除了我下面推荐的图书、文章和代码,一定要多百度和google寻找学习资料);

(2)做一些非常简单的nlp入门小任务,通过小任务理解自然语言处理的流程(包括中英文nlp处理流程的差别);

(3)快速学习一门开发nlp技术的编程语言(基本就是python了,不需要学习网络编程等部分,重点掌握python基本语法文件读写与编码正则表达式gensimnumpypandasmatplotlib等的使用);

(4)学习机器学习的相关概念,如:模型评估与选择、有监督学习、半监督学习、无监督学习、强化学习、迁移学习(只需要学习和认识其原理,做到心中有数即可);

(5)关注各大内容大V,如:微信公众号(paperweekly、新智元、AI科技大本营、机器之心、人工智能头条等),知乎(一搜自然语言处理或者nlp就能看到好多大V),博主(我爱自然语言处理等),因为每天各大V都会发布很多的新闻和内容,初入门的小白不建议全篇深入阅读,感兴趣的可以收藏起来以后看,大部分就了解一下(1)“谁”(2)“干了啥,咋干的”(3)“啥效果”,然后读了这个文章的报道(4)“自己有啥想法”,就可以了(有一个小细节上的建议,就是在平日里有任何idea最好都要在手机或者任何地方的备忘录里记一下,也要尽快多实践以验证idea是否有效);

(6)了解国内外nlp的协会组织(如:中文信息学会、中文信息学会青年工作委员会、ACL等,主要查找和阅读协会开辟的专栏、组织撰写的综述、看看最近都组织了什么会议比赛等)、主要的大型nlp科研团队(斯坦福、多伦多、清华、北大、哈工大、复旦、中科、deepmind、google brain、openAI等高校、院所和科研机构的自然语言处理小组,看看他们都在研究什么);

(7)关注“中国中文信息学会”的微信公众号,时刻关注ACL、IJCAI、ACML、SIGIR等顶会论文报告会(由中文信息学会组织,报告的人都是当年被顶会录取的论文的国内作者和大佬,来自各大高校和院所,整个报告会和国际会议的日程都是一样的,都有coffee break可以在茶歇的时候近距离与大佬交流,是一个近距离与国内各大NLP大组老师、同学交流的机会看看大厂们都在干什么,推荐有机会的话一定要去听一下报告,但一定要保证已经看过很多论文、并且有一定基础再去听,完全零基础不建议去,会议比较火爆和受欢迎,建议时刻关注尽快报名)。

nlp非常容易入门的原因是这是一门非常开放的学科,各大高校、学者都有一颗开放的心,源码经常开源、而且有很多优秀的老师有写博客、博文的习惯,大家都喜欢一有研究成果就立马放到arxiv或者researchgate上,nlp的研究日新月异、变化的非常快的原因就是“开放”,所以有什么问题尽量面向百度、google查询,注意关键词(毕竟是搞nlp的,可以先学习一下检索的原理,然后就知道怎么检索能尽快找到你想要的的东西),检索的结果重点关注reddit、medium、csdn、arxiv、researchgate、知乎、stackoverflow、github等上面的内容。

可参考学习和实践的链接如下:

  1. 复旦大学邱锡鹏组实验室新生一般完成的五个NLP练习上手实验(NLP四大类任务:分类、序列标注、文本匹配、文本生成,都需要完整实现一遍)。
    https://www.zhihu.com/question/324189960/answer/682130580?utm_source=wechat_session&utm_medium=social&utm_oi=952466020582064128
  2. 自动化所宗成庆研究员:读懂NLP的过去与现在(梳理的非常好,把各个概念之间的关系和NLP的发展都梳理清楚了)
    https://mp.weixin.qq.com/s/xgySwq2m-mHT7XG1zZGpzw
  3. 中文自然语言处理入门实战
    https://mp.weixin.qq.com/s/5z7Xy4NL-buUkpBmv4iIpw
  4. 自然语言处理全家福:纵览当前NLP中的任务、数据、模型与论文
    https://mp.weixin.qq.com/s/sQ903WNSR4v367t78_VG1Q
  5. 中文信息处理发展报告(综述由中文信息学会统筹,国内各大NLP专家撰写,非常适合入门了解NLP)
    http://cips-upload.bj.bcebos.com/cips2016.pdf
  6. Jumping NLP Curves: A Review of Natural Language Processing Research [Review Article]
    https://ieeexplore.ieee.org/document/6786458
  7. Natural Language Processing: A Review
    https://www.researchgate.net/publication/309210149_Natural_Language_Processing_A_Review
  8. A Review of the Neural History of Natural Language Processing
    http://ruder.io/a-review-of-the-recent-history-of-nlp/
  9. 邓力和刘洋大神合著的图书《Deep Learning in Natural Language Processing
    (就不给链接了,百度或google搜索,有中文连载、英文原版的原版图书购买、pdf分享或者课程)
  10. 宗成庆研究员所著《统计自然语言处理》(经典之作)
  11. Steven Bird所著《Python自然语言处理》(快速掌握python开发nlp技术的各种能力)
  12. 机器学习 → 推荐周志华教授所著的《机器学习
  13. 深度学习 → 推荐Ian Goodfellow等人合著的《Deep Learning
  14. 开发框架 → 首推Pytorch,推荐陈云的《深度学习框架Pytorch入门与实践》或者廖星宇的《深度学习入门之Pytorch
  15. Tensorflow学习 → 推荐黄文坚、唐源的《Tensorflow实战

(注意有些情况需要“科学上网”,一定要掌握google和google scholar的使用)

零基础入门自然语言处理的学习建议相关推荐

  1. Datawhale 零基础入门数据挖掘心跳信号分类学习反馈

    Detail 零基础入门数据挖掘 (心跳信号分类) 学习反馈TASK1 使用语言:python Tas1 – Task5 Task1 赛题理解: 根据给定的数据集,建立模型,预测不同的心跳信号(以预测 ...

  2. Datawhale 零基础入门数据挖掘心跳信号分类学习反馈03

    Detail 零基础入门数据挖掘 (心跳信号分类) 学习反馈TASK3 使用语言:python Tas1 – Task5 Task3_数据特征工程分析 主要是针对时间序列的心电图数据加上:特征time ...

  3. Datawhale 零基础入门数据挖掘心跳信号分类学习反馈04

    Detail 零基础入门数据挖掘 (心跳信号分类) 学习反馈TASK3 使用语言:python Tas1 – Task5 Task4 建模与调参 本次学习的重点是贪心调参.网格搜索调参.贝叶斯调参共三 ...

  4. Datawhale 零基础入门数据挖掘心跳信号分类学习反馈02

    Detail 零基础入门数据挖掘 (心跳信号分类) 学习反馈TASK2 使用语言:python Tas1 – Task5 Task2_数据探索性分析 涉及函数:总览+判断数据缺失和异常+分布 data ...

  5. 电脑入门完全自学手册_3DMAX零基础入门到精通的学习路线和教程

    没有美术基础可以学建模吗?毋庸置疑,只要肯学都是可以的!那么我们今天来说说零基础学习建模要着重注意什么.最高效最快速的入门学习方式:看知识兔视频课程,跟着知识兔老师操作,听知识兔老师讲解,初学者不要自 ...

  6. 零基础入门FPGA,如何学习?

     问:本人零基础,想学FPGA,求有经验的人说说,我应该从哪入手,应该看什么教程,应该用什么学习板和开发板,看什么书等,希望有经验的好心人能够给我一些引导. 如果想速成,那就上网看视频吧,这样主要是面 ...

  7. 零基础入门UI设计需要学习哪些内容

    UI设计是指对软件的人机交互.操作逻辑.界面美观的整体设计,随着互联网的飞速发展以及用户体验度的提高,UI设计师成为新晋的高薪贵族,深受各大企业青睐.很多零基础的人都想加入UI设计行业实现高薪,下面一 ...

  8. Python大数据综合应用 :零基础入门机器学习、深度学习算法原理与案例

    机器学习.深度学习算法原理与案例实现暨Python大数据综合应用高级研修班 一.课程简介 课程强调动手操作:内容以代码落地为主,以理论讲解为根,以公式推导为辅.共4天8节,讲解机器学习和深度学习的模型 ...

  9. Task04——零基础入门NLP - 基于深度学习的文本分类1

    学习目标 学习fasttext使用和基本原理 学会使用验证集进行调参

最新文章

  1. C_str的入门级notes
  2. github如何make contribute to 其它开源项目
  3. bgp 建立邻居发送的报文_大型网络BGP之IBGP和EBGP邻居关系基础配置
  4. asp.net menu Operation aborted
  5. 组合总和(可重复使用)Python解法
  6. 「译」 .NET 5 新增的Http, Sockets, DNS 和 TLS 遥测
  7. 开发人员如何学习 Kubernetes
  8. 20幅扎心漫画,道尽无数人的人生!30万网友:这简直是在偷窥我生活...
  9. pcb成型板aoi检测_基于AOI技术的PCB常见质量缺陷检测
  10. 瞧!公务员的工作还可以这样干
  11. 鸿蒙系统的适配国产手机,真正的好消息!其它国产机,也在适配华为鸿蒙系统...
  12. 宠物狗图片分类之迁移学习代码笔记
  13. 机器学习 -- 用户画像
  14. iphone app开发实战很重要:《iPhone App开发实战手册》读后感
  15. 第一节:setTimeout和setInterval定时器
  16. Atitit 知识与数据 信息 加工方法总结 目录 1.1. 信息加工是指通过判别、筛选、分类、排序、分析和研究等一系列过程 1 1.2. 多种聚合方法 1 2. 首先通过聚类信息 专题化 分组聚
  17. Idea 格式化代码 Idea设置快捷键 格式化代码
  18. 计算机软件研究方法与技术路线,毕业论文研究方法与技术路线
  19. 4.3.5 导频插入
  20. 华为语音解锁设置_华为手机语音唤醒解锁 华为语音助手解锁屏幕

热门文章

  1. 使用Python+OpenCV实现姿态估计
  2. tagVARIANT、VARIANT、_variant_t和COleVariant
  3. 压力测试衡量CPU的三个指标:CPU Utilization、Load Average和Context Switch Rate
  4. 密码学系列——MD5算法理解记录
  5. DM创建DBLINK连接oracle
  6. ios苹果企业签名操作方法及使用流程
  7. Buck电路工作原理以及三种工作模式分析
  8. 公网rtsp流媒体测试地址
  9. 【Python之numpy库】5.np.piecewise 操作方程
  10. 在企业微信调试js神器