本帖是对(印度)Jalaj Thanaki作品《python自然语言处理》的翻译、缩减及改编~

nlp的基础应用

NLP是AI的子分支,其相关概念可以用于以下专家系统中:
语音识别系统
问答系统
机器翻译
文本摘要
情感分析
基于模板的聊天机器人
文本分类
主题分割

nlp的高级应用

·理解自然语言指令并通过自然语言同人类交互的类人机器人。

·构建一个通用机器翻译系统是NLP领域的长期目标之一。因为你可以轻松地构建两个特定语种之间的机器翻译系统,但这个系统并不能用来翻译这两个语种之外的其他语言。在深度学习的帮助下,我们可以构建一个通用的机器翻译系统,谷歌最近声称已经非常接近这一目标了。

·为指定文档生成逻辑标题的NLP系统是高级应用之一。在深度学习的帮助下,我们可以为文档生成标题和摘要。

·为某个主题图像生成文本是一种高级NLP应用。

·为人类生成个性化文本并忽略手写错误的高级机器人也是我们努力的目标之一。图1展现了更多的NLP应用。

图1--NLP领域相关的更多深层应用

NLP和Python相结合的优势

下面的几个因素决定了 Python是构建自然语言处理专家系统的最佳选择之一·。使用Python为基于NLP的专家系统开发原型相当快速和便捷。

·有大量的开源NLP库可供 Python程序员使用。

·社区支持非常强力。

·易于使用,对初学者而言不复杂。

·快速开发:测试和评估都很简单。

·许多新框架,如 Apache Spark、 Apache Flink、 TensorFlow等,都提供 Python接口·相比其他编程范式,使用 Python构建的基于NLP的系统的最优化更为简单。

nltk环境搭建

建议本书的所有读者都从 GitHub 上获取NLPython项目的分支,项目地址是https://github.com/jalajthanaki/NLPython

本书使用 Linux(Ubuntu)作为操作系统。如果对 Linux不太熟悉,最好试着习惯使用它,因为大部分的高级框架,如 Apache Hadoop、 Apache Spark、 Apache Flink、 Google TensorFlow等,都需要 Linux系统环境。

GitHub项目中包含了如何安装 Linux,以及本书将要用到的基础 Linux命令的教学。如果你对Git不太了解,同样可以在项目中找到基础的 github 操作命令,链接是https://github.com/jalajthanaki/NLPython/tree/master/ch1/documentation

本章所需环境的安装指南见地址https://github.com/jalajthanaki/NLPython/tree/master/ch1/documentation

GitHub项目包含了安装指南、代码和wiki页面等。如果读者有任何问题,可以把它们发在 Gitter小组上。Gitter小组的网址是https://gitter.im/NLPython/Lobby

安装nltk的步骤如下

①其实最简单的安装方法就是直接在Google colab输入:

import nltk
nltk.download("popular")

②而书上提供的方法是针对Ubuntu的:

Installation and setup NLTK enviroment on Linux Ubuntu 14.04 (recommended way)

import sys
sys.version
sys.version_info 2_Pythonsys.version_info(major=2, minor=7, micro=6, releaselevel='final', serial=0)Installation of pyhton on Ubuntu 14.04Ubuntu system has pyhton 2.7.X inbuilt no need to download and install it To confirm whether python has been properly install or not do following steps.Step 1: Open system terminal
Step 2:
$ python -V
Python 2.7.6Install pip and setup tools On Linux ubuntu 14.04What is pip?
pip is a package management system used to install and manage software packages written in PythonOpen your system's terminal and execute following commands$ sudo apt-get install -y python-pip
$ sudo pip install -U pip
$ sudo pip install setuptools==33.1.1Confirm pip has been installed successfully.$ pip -V
pip 9.0.1 from /usr/local/lib/python2.7/dist-packages (python 2.7)Next step is to install nltk package and download nltk dataInstallation steps for NLTK on terminal execute following command
$ sudo pip install nltk
$ pythonAfter this now you are inside the python shell and check your nltk package install properly or not$ python
Python 2.7.6 (default, Oct 26 2016, 20:30:19)
[GCC 4.8.4] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>>import nltk
>>>nltk.download()Choose the path where you wnat to download nltk data and click "Download" option.Download process may take long time.
you can refer the diagram 1.4 given in chapter no 1OR If you don't want to go inside python shell you can open your system's terminal and execute the following command
Command : sudo python -m nltk.downloader -d PATH_OF_NLTK_DATA all
Actual command : sudo python -m nltk.downloader -d /usr/local/share/nltk_data all

读者提示

本书是一本实用指南。作为专业人士,我强烈建议读者复现 GitHub上的代码,并完成书中的练习,这有助于理解NLP概念。不经练习而想彻底了解NLP几乎是不可能的,我保证这些代码很有趣。接下来的章节内容如下:

NLP概念解释
相关应用
NLP概念的必要性
实现概念的可行方法(代码都在 GitHub上)
面临的挑战
克服挑战的方法
练习

python QTreeWidgetItem下面有几个子tree_python-nlp ch1笔记:nlp的基础应用、高级应用、python优势、nltk环境搭建...相关推荐

  1. python QTreeWidgetItem下面有几个子tree_非常干货:Python 探针实现原理

    ↑↑↑关注后"星标"简说Python 人人都可以简单入门Python.爬虫.数据分析 简说Python推荐 来源:https://segmentfault.com/a/119000 ...

  2. python基础开发环境_Python基础教程,第一讲,开发环境搭建

    今天是写Python基础教程的第一课,也是下定决心做技术分享的第一篇文章.先扯几句和技术无关的吧,也便于大家了解这套课程的内容,适不适合自己学习,我做开发6年了,已年过30,一直从事的WEB方面的开发 ...

  3. 学习笔记-大数据基础实训(python语言+可视化)

    实训指导书 一.实训目的 利用python从指定接口爬取广东省各个地市的气象数据,存储并进行数据分析和可视化 二.实训任务列表 给定以下3个接口: 1.http://www.nmc.cn/f/rest ...

  4. python 建站需求_玩转Django2.0---Django笔记建站基础十一(一)(音乐网站开发)

    第十一章 音乐网站开发 本章以音乐网站项目为例,介绍Django在实际项目开发中的应用,该网站共分为6个功能模块分别是:网站首页.歌曲排行榜.歌曲播放.歌曲点评.歌曲搜索和用户管理. 11.1 网站需 ...

  5. python零基础怎么学-Python怎么学?零基础如何顺利入门Python?

    点击蓝字"python教程"关注我们哟! 当你想要进入一个全新的领域时,首先要弄清楚的就是它的体系.那么在Python领域,应该掌握哪些知识点呢? Python基础与高级编程 1. ...

  6. python怎么把所有标点符号置空_Python从小白到攻城狮(1)——python环境搭建

    我的微信公众号:代码视界,欢迎关注. Python介绍 Python是Guido van Rossum在1989年圣诞节期间,为了打发无聊的圣诞节而编写的一个编程语言,1991年发布第一版. Pyth ...

  7. python import 类如何捕获clrt c_Python3 与 C# 扩展之~基础衍生

    本文适应人群:C# or Python3 基础巩固 马上快期末考试了,老师蜜月也回来了,于是有了一场跨季度的复习讲课了: 1.Python基础语法扩展¶ 1.1.if 判断条件相关¶ None.&qu ...

  8. python矩阵运算法则_0基础4天掌握Python数据挖掘2-12-矩阵运算

    0基础4天掌握Python数据挖掘2-12-矩阵运算 传智播客博学谷 2020/12/10 10:21 介绍: 课程简介 该阶段主要是介绍一些数据科学领域用Python语言实现的基础库,如简洁.轻便的 ...

  9. 最全知乎专栏合集:编程、python、爬虫、数据分析、挖掘、ML、NLP、DL...

    上一篇文章<爬取11088个知乎专栏,打破发现壁垒>里提到,知乎官方没有搜素专栏的功能,于是我通过爬取几十万用户个人主页所关注的专栏从而获取到11088个知乎专栏. 本回筛选出其中涉及:编 ...

最新文章

  1. 【机器学习】【条件随机场CRF-3】条件随机场的参数化形式详解 + 画出对应的状态路径图 + 给出对应的矩阵表示...
  2. 简单shell 学习
  3. Solr单集代码调用案例
  4. 各大公司容器云的技术栈对比
  5. 怎么用python做战斗机_关于python文件操作
  6. java虚拟机之三--理解Java虚拟机体系结构
  7. 使用虚拟按钮(Ghost Buttons)的25个网站
  8. typeof---JavaScript
  9. 绿坝捅乱子,全球看笑话
  10. QT自定义按钮类(自定义图片,形状,点击特效)
  11. P8462 「REOI-1」奶油蛋糕
  12. 树莓派python语音唤醒_唤醒DuerOS Python SDK(解决声音切回树莓派的问题)
  13. 感谢米老师,感谢提高班,做个骄傲的自己
  14. 微信小程序免费资源大全
  15. 第一次用gcc命令时报错:gcc: 未找到命令...
  16. 这一年,半导体行业风云变幻
  17. zip与unzip一般压缩和带密码压缩与解压缩
  18. 服务器开启二次虚拟化,云服务器支持二次虚拟化
  19. 【java】批量上传图片并回显功能
  20. 华南理工大学计算机考研历年分数线,2020华南理工大学研究生分数线(以及历年复试)...

热门文章

  1. php date 有warning,php提示PHP Warning: date(): It is not safe to rely on the......错误的解决办法...
  2. Tomcat 服务:解决 Apache Tomcat 更新后 Tomcat9w.exe 无法启动 Tomcat 服务的问题
  3. 均衡原理_干货什么是负载均衡?负载均衡原理详解
  4. kafka-manager配置和使用
  5. AOE网的关键路径的计算
  6. hdfs的副本数为啥增加了_HDFS详解之块大小和副本数
  7. (2021) 24 [持久化] 文件系统API
  8. html计算器_学习HTML、CSS和JavaScript的最佳方法是什么?
  9. mac mysql prefpane_【MySQL数据库开发之一】Mac下配置安装数据库-MySQL
  10. h5优秀控件_H5前端学习的js插件大全,基本包含了大部分的前端最前沿的js插件和库。...