安装Anaconda
安装NLTK

安装Anaconda

下载Anaconda 中 支持python 3.5(WIN 7)版本(本人桌面系统环境)

  • 地址 : https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/?C=N&O=D

  • 地址:https://repo.continuum.io/archive/

  • 文件:https://repo.continuum.io/archive/Anaconda3-4.2.0-Windows-x86_64.exe

修改Anaconda中的Jupyter Notebook默认工作路径

打开Windows的cmd,在cmd中输入jupyter notebook --generate-config
可以看到路径为C:\Users……找到此路径修改jupyter_notebook_config.py文件
打开此文件找到
#c.NotebookApp.notebook_dir = ‘’
将其改为
c.NotebookApp.notebook_dir = ‘C:/Users/Administrator/workspace/Jupyter’
其中C:/Users/Administrator/workspace/Jupyter为我的工作空间,你可以改成你自己的,
注意:
1.#c.NotebookApp.notebook_dir = ''中的#必须删除,且前面不能留空格。
2.Jupyter文件夹必须提前新建,如果没有新建,Jupyter Notebook会找不到这个文件,会产生闪退现象。
3.但是当我们通过快捷方式再次打开后,发现还是没有变化,因为还需要在快捷方式的目录里面的
%USERPROFILE%删除

安装ANLTK

打开Anaconda Prompt,输入conda install nltk 安装ANLTK

输入python启动python-shell环境

import nltk
nltk.download()


选择需要下载的内容,修改数据存储路径(c:\nltk_data)

建议:

官网的镜像在境外,所以直接update可能会比较慢或者不能访问。
用中科大的镜像
conda config –add channels https://mirrors.ustc.edu.cn/anaconda/pkgs/free/
conda config –set show_channel_urls yes

加个小tip:要删除 .condarc文件 。
.condarc以点开头,一般表示 conda 应用程序的配置文件,在用户的根目录
(windows:C:\users\username\,linux:/home/username/)。但对于.condarc配置文件,是一种可选的(optional)运行期配置文件,其默认情况下是不存在的。
当用户第一次运行 conda config命令时,将会在用户的家目录创建该文件。

让python pip使用国内镜像
国内源:
清华:https://pypi.tuna.tsinghua.edu.cn/simple

阿里云:http://mirrors.aliyun.com/pypi/simple/

中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/

华中理工大学:http://pypi.hustunique.com/

山东理工大学:http://pypi.sdutlinux.org/

豆瓣:http://pypi.douban.com/simple/

note:新版ubuntu要求使用https源,要注意。

临时使用:
可以在使用pip的时候加参数-i https://pypi.tuna.tsinghua.edu.cn/simple
例如:pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pyspider,这样就会从清华这边的镜像去安装pyspider库。

永久修改,一劳永逸:
Linux下,修改 ~/.pip/pip.conf (没有就创建一个文件夹及文件。文件夹要加“.”,表示是隐藏文件夹)

内容如下:

[global]
index-url = https://pypi.tuna.tsinghua.edu.cn/simple
[install]
trusted-host=mirrors.aliyun.com
windows下,直接在user目录中创建一个pip目录,再新建文件pip.ini。(例如:C:\Users\WQP\pip\pip.ini)内容同上。

也就是说,今天开始必须恢复官方源了

使用以下语句可以恢复到默认源。

conda config --remove-key channels
如果还是嫌慢,那么命令行科学上网方式可以使你加快速度。

使用conda 创建虚拟环境报错,

conda config --add channels http://mirrors.aliyun.com/pypi/simple/
conda config --set show_channel_urls yes

删除了 defaul
问题解决

conda update --all

conda install tensorflow-gpu
conda install keras-gpu

恢复清华源
channels:

  • https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
  • https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
    show_channel_urls: true
    ssl_verify: true

致谢
《Python自然语言处理》1 2 3,作者:【印】雅兰·萨纳卡(Jalaj Thanaki),是实践性很强的一部新作。为进一步深入理解书中内容,对部分内容进行了延伸学习、练习,在此分享,期待对大家有所帮助,欢迎加我微信(验证:NLP),一起学习讨论,不足之处,欢迎指正。

参考文献


  1. https://github.com/jalajthanaki ↩︎

  2. 《Python自然语言处理》,(印)雅兰·萨纳卡(Jalaj Thanaki) 著 张金超 、 刘舒曼 等 译 ,机械工业出版社,2018 ↩︎

  3. Jalaj Thanaki ,Python Natural Language Processing ,2017 ↩︎

《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:01 WIN 7 Anaconda python 3.5 NLTK 安装配置相关推荐

  1. 《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:08 自然语言处理中的机器学习方法

    08 自然语言处理中的机器学习方法 8.1 机器学习的基本概念 8.1.1 ML类型 8.1.2 ML 监督学习 8.1.3 无监督学习 8.1.4 强化学习 8.2 自然语言处理应用的开发步骤 8. ...

  2. 《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:07 规则式自然语言处理系统

    07 规则式自然语言处理系统 7.1 规则式系统 7.2 规则式系统的目的 7.2.1 为何需要规则式系统 7.2.2 使用规则式系统的应用 7.2.3 练习 7.2.4 开发规则式系统需要的资源 7 ...

  3. 《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:05 特征工程和NLP算法

    05 特征工程和NLP算法 5.1 理解特征工程 5.1.1 特征工程的定义 5.1.2 特征工程的目的 5.1.3 一些挑战 5.2 NLP中的基础特征 5.2.1 句法解析和句法解析器 5.2.2 ...

  4. 《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:06 高级特征工程和NLP算法

    06 高级特征工程和NLP算法 6.1 词嵌入 6.2 word2vec基础 6.2.1 分布语义 6.2.2 定义word2vec 6.2.3 无监督分布语义模型中的必需品 6.3 word2vec ...

  5. 《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:11 如何提高你的NLP技能

    11 如何提高你的NLP技能 11.1 开始新的NLP职业生涯 11.2 备忘列表 11.3 确定你的领域 11.4 通过敏捷的工作来实现成功 11.5 NLP和数据科学方面一些有用的博客 11.6 ...

  6. 《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:04 预处理

    03 预处理 4.1 处理原始语料库文本 4.1.1 获取原始文本 4.1.2 小写化转换 4.1.3 分句 4.1.4 原始文本词干提取 4.1.5 原始文本词形还原 4.1.6 停用词去除 4.2 ...

  7. 《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:10 高级工具

    10 高级工具 10.1 使用Apache Hadoop作为存储框架 10.2 使用Apache Spark作为数据处理框架 10.3 使用Apache Flink作为数据实时处理框架 10.4 Py ...

  8. 《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:12 安装指导

    12 安装指导 12.1 安装Python.pip和NLTK 12.2 安装PyCharm开发环境 12.3 安装依赖库 12.4 框架安装指导 12.5 解决你的疑问 12.6 总结 本附录为您提供 ...

  9. 《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:03 理解句子的结构

    03 理解句子的结构 3.1 理解NLP的组成 3.1.1 自然语言理解 3.1.2 自然语言生成 3.1.3 NLU和NLG的区别 3.1.4 NLP的分支 3.2 上下文无关文法 3.3 形态分析 ...

  10. 《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:02 语料库和数据集

    什么是语料库? 为什么我们需要语料库? 理解语料库分析? 数据属性的类型 语料库的不同文件格式 免费语料库的资源 为NLP应用准备数据集 网页爬取 什么是语料库? 在语料库中,大数据集合可以采用以下格 ...

最新文章

  1. 如何判断服务器遭到***
  2. aspose.words 合并相同值的单元格_合并相同的单元格,你用了1小时,同事只要30秒,还支持自动刷新...
  3. Socket编程(C语言实现)—— 为什么流式传输类似于管道?不区分边界?
  4. Random Forests
  5. 字典删除多个键值对方法_Life is short,you need Python——Python序列(元组、字典、集合)...
  6. 二十万字C/C++、嵌入式软开面试题全集宝典五
  7. sqlserver数据库大型应用解决方案总结 数据库负载均衡
  8. Windows驱动开发如何入门
  9. matlab同步发电机外特性仿真,基于Matlab-Simulink的虚拟同步发电机控制方法的仿真研究...
  10. 使用sklearn优雅地进行数据挖掘
  11. 广告点击率预测_用于广告点击率预测的逻辑回归你会了吗?
  12. 黄聪:wordpress教程
  13. php ora01017,建立DBLINK报ORA-01017,ORA-02063
  14. 指定条件查找计算机,利用excel数组函数完成“根据给定条件查找匹配数据”-excel技巧-电脑技巧收藏家...
  15. 《信贷的逻辑与常识》笔记
  16. 倍福beckhoff详细知识库展示
  17. samba服务器讲解
  18. CrashReport(崩溃日志)分析方法
  19. 使用easypoi导出注解添加序号,无须重写ExcelExportUtil类
  20. 计算机病毒在我国的发展情况,计算机病毒检测技术的现状与发展

热门文章

  1. 320亿美元收购ARM出价过高?软银股价跌幅超10%
  2. VC++ 修改计算机名称 SetComputerName
  3. opencv边界识别
  4. 如何统计项目代码(比如微信小程序等等)
  5. APC破解虚拟化时代的数据中心挑战
  6. 前端_#网页设计大作业 总结随记
  7. 批量新增,存在就修改
  8. android申请内录功能吗,如何使Android录音实现内录功能
  9. Office 部署工具
  10. linux 下ntp服务器,Linux下NTP服务器搭建(示例代码)