自然语言处理入门读物

本文目前研二,已经接触自然语言处理有一年的时间(半路出家),下面写一点自己关于自然语言处理的心得(纯属个人见解),先从入门学习开始写吧。


书籍-理论篇

书籍是人类进步的阶梯,这个一点不假,自己刚开始接触自然语言处理是从吴军老师的的《数学之美》开始的,这里再次感谢吴军老师。这门书写的通俗易懂,内容非常的吸引人,读起来不会感觉枯燥,每次读都会有新的体会。
本书可以作为自然语言处理入门的第一本书,书中的知识一定要查阅其他文献和博客,因为本书并没有对内容讲的特别的细,所以每个知识都包含了大量的拓展内容。例如:隐马尔可夫的内容,其实远比书中将的多,所以拓展是配合本书的不二法门。

第二本书推荐《统计自然语言处理(第2版)》(宗成庆)蓝皮版,这本书是宗老师的心血之作,内容较《数学之美》的内容更加的偏特定领域,对自然语言处理领域有宗老师自己独特的见解。书本内容涉及自然语言处理的大部分方向,且对重要的知识点给出了较为详细的理论推导,语言通俗易懂。

第三本书推荐《统计学习方法》(李航),这本书的内容就更加偏数学化,主要对自然语言处理,特别是统计自然语言处理中应用的模型给出了非常详尽的数学公式推导,建议有一定数学功底的同学阅读(因为我读起来很吃力)。

此外,还有很多业界推荐的好书:《自然语言处理简明教程》(冯志伟),《自然语言处理综论》(Daniel Jurafsky),《自然语言处理的形式模型》(冯志伟),但是这些书因为时间和个人精力有限,尚未曾阅读,此处仅列出。


书籍——实践篇

自然语言处理领域使用较多的语言是python,所以建议使用python来处理自然语言处理领域的相关内容;另外自然语言处理领域,特别是基于统计的自然语言处理以及当前大热的深度学习下的自然语言处理,往往使用大量的机器学习知识和深度学习知识。

书籍推荐1:python基础教程(翻译版),本书的内容已经足够入门了,书本的内容不必大而全的全部阅读,抓住主要的,想要精通以后慢慢来。

python入门博客推荐2:廖雪峰的python教程 非常的不错,也是抓住主要的。
以上两个已经足够我们python入门啦。

python练习环境推荐3:强烈推荐ipython和ipython notebook,不知道的百度哦,谁用谁知道。

机器学习书籍推荐4:《机器学习实战》,这本书中的内容既有理论说明也有代码讲解,并且代码可以在书本提供的网站上下载,但是不推荐一上来就看这本书,因为如果原理没搞懂,直接上代码,感觉不理解;此外书本中用到了numpy等python库,若之前对其没有了解,直接学习,比较痛苦。

机器学习书籍推荐5:西瓜书《机器学习》(周志华),本人有周老师亲笔签名的书籍,想想都开心。本书的内容介绍非常全面,知识讲解也非常的到位,理论知识较多,代码不多,非常适合阅读。主要是国内的,国内的,国内的,没错这本书是国内的,不是翻译的,支持,必须支持。
既然学习了python和机器学习,那总不能python停留在练习上,机器学习停留在理论上吧,所以:

书籍推荐6:《集体智慧编程》,《python自然语言处理》,前一本是使用python语言,编写代码实现一些现实的问题,通过学习可以切实的感受到原来他一直都在,只是我不知道。。。。。后者介绍了python的一个自然语言处理库NLTK,使用该库解决自然语言处理中的任务。

至此,理论也有了,实践也有了,可以说非常完美了。神马,还不够,你觉得读书太累,一读就困。。。。。。那你就看点视频吧


视频

推荐1自然语言处理-宗庆成
不要问我怎么样,因为我没看过,因为我不可能什么都看过。但是宗老师的课那是没问题的。

推荐2自然语言处理-关毅
这个课我看过,感觉不错。

推荐3计算语言学概论_侯敏
本人没看过。

推荐4 哥伦比亚大学的自然语言处理,英文的。具体的课程地址已经变动,可以百度一下。也可以看一下他人的博客自然语言处理大菜鸟 ,自己英语不好,就看看别人的心得喽。当然coursera上还有一些其他的视频资源,如果你的英语还可以,可以去平台上搜索一下。

自然语言处理已经有视频来了,那么机器学习有什么视频看吗?当然有


推荐5 mooc学院-机器学习 这个视频是大牛Andrew Ng讲的,非常的不错,毕竟是大牛嘛,比我等凡人理解的深太多了。

推荐6 这个推荐就是众多的mooc网站了,因为推荐5是我自己看的视频,但是很多慕课网站都存在机器学习课程,如网易公开课-机器学习,也是Andrew Ng讲的;慕课网-初识机器学习 ;台湾大学林轩田机器学习 林老师的机器学习讲解,非常的不错。

现在好啦,我们可以拿本书,一边学习书本知识,一边看视频讲解,我想这会让自己很快的入门,想想都开心。。。。

机器学习领域重要的会议

  1. 国际机器学习会议(ICML)
  2. 国际神经信息处理系统会议(NIPS)
  3. 国际学习理论会议(COLT)
  4. 欧洲机器学习会议(ECML)
  5. 亚洲机器学习会议(ACML)

重要的国际学术期刊

  1. Journal of Machine Learning Research
  2. Machine Learning
  3. IJCAI
  4. AAAI
  5. Artificial Intelligence
  6. Journal of Artificial Intelligence Research

参考:
1 自然语言处理怎么最快入门 知乎上的大神

自然语言处理入门读物相关推荐

  1. 《自然语言处理入门》不是 NLP 学习路上的万能药

    <自然语言处理入门>是图灵 2019 年 10 月出版的一本 NLP 领域的入门图书,作者是何晗(网名 hankcs,HanLP 作者.「码农场」博客博主).图书上架之后得到了广大的读者的 ...

  2. 自然语言处理入门——新手上路

    目录 一.自然与语言与编程语言 二.自然语言处理的层次 三. 自然语言处理的流派 五.语料库 六.开源工具 七 总结 自然语言处理(NLP)是一门融合了计算机科学.人工智能以及语言学的交叉学科. 一. ...

  3. 【实战教程】NLP-Beginner:自然语言处理入门练习

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 今天给大家分享一门很好的NLP入门学习实战仓库,话不多说,学它!!! 此项目完成了 ...

  4. NLP汉语自然语言处理入门基础知识介绍

    NLP汉语自然语言处理入门基础知识介绍 自然语言处理定义: 自然语言处理是一门计算机科学.人工智能以及语言学的交叉学科.虽然语言只是人工智能的一部分(人工智能还包括计算机视觉等),但它是非常独特的一部 ...

  5. NLP-Beginner:自然语言处理入门练习-任务一

    NLP-Beginner:自然语言处理入门练习 任务一:基于机器学习的文本分类 深度学习项目,在训练之前,一般均会对数据集做shuffle,打乱数据之间的顺序,让数据随机化,这样可以避免过拟合. Ba ...

  6. HanLP《自然语言处理入门》笔记--5.感知机模型与序列标注

    笔记转载于GitHub项目:https://github.com/NLP-LOVE/Introduction-NLP 5. 感知机分类与序列标注 第4章我们利用隐马尔可夫模型实现了第一个基于序列标注的 ...

  7. 量化交易入门读物列表

    量化交易入门读物列表 勿当作专业人员的推荐来看. 量化交易入门-译言网 当真躺着赚钱?量化交易的十大难题 一文弄懂量化交易 怎样躺着赚钱? Quantitative Trading: How to B ...

  8. HanLP《自然语言处理入门》笔记--1.新手上路

    文章目录 1. 新手上路 1.1 自然语言与编程语言的比较 1.2 自然语言处理的层次 1.3 自然语言处理的流派 1.4 机器学习 1.5 语料库 1.6 开源工具 1.7 总结 1.8 GitHu ...

  9. python自然语言处理入门教程(一)

    1.NLTK自然语言处理工具包 1.1 NLTK简介 NLTK是构建Python程序与人类语言数据工作的主要平台.它提供了易于使用的界面,以超过50语料库和词汇资源,如WordNet的,连同一套文字处 ...

最新文章

  1. 呵呵,你开心就好!——AI向杠精宣战
  2. Java并发编程:线程封闭和ThreadLocal详解
  3. Ubuntu14.04下安装wechat(微信)
  4. 最大识车数据集:6.4万张车型参数完整标注,交通安防二手都能用
  5. 编java用jdk还是editplus_怎样运用EditPlus进行配置Java编译环境
  6. python request file upload_Python request 上传文件
  7. python判断正数和负数教案_正数和负数 教学设计
  8. java jsp ajax_ajax的json传值方式在jsp页面中的应用
  9. 征稿 | ​第 9 届国际语义技术联合会议征稿(截稿日 9 月 8 号)
  10. 电脑显示无法连接sql服务器,他人的电脑为什么无法连接我电脑上的sql sever服务器...
  11. ARM 指令集跳转指令
  12. 3.15 曝光:40 亿 AI 骚扰电话和 11 家合谋者
  13. java不规则数组杨辉,JAVASE课程 第一章 第三讲程序控制与数组
  14. 常见的协议号和端口号
  15. 基于wiki的*GW需求体系化空间
  16. 指纹识别技术相比于其它生物识别技术,有哪些优缺点?
  17. ffmpeg 音频合并
  18. 实时音视频是什么?有哪些新的应用场景
  19. 如何选择适合你的兴趣爱好(六十六),折纸
  20. 无法打开网页版晓木虫怎么办?

热门文章

  1. Ajax跨域代理文件
  2. 自制linux开发板安装系统,6410开发板linux系统安装流程
  3. LiveGBS国标GB/T28181国标视频流媒体平台-功能报警告警订阅查询报警预案截图保存视频及REDIS消息订阅
  4. TTL电平与CMOS电平的区别与联系
  5. 【力扣刷题 | 第十九天】
  6. 纪念SlingShot 矩阵快速幂 构造矩阵
  7. 51单片机的中断系统详解
  8. FPGA NCO+LPM_MULT+FIRip核 实现乘法+低通滤波 使用及仿真(quartusii 13.1+modelsimse 10.5)
  9. 区块链溯源:如何确保溯源信息的准确性
  10. UG\NX二次开发 显示所有图层上所有的对象