最近在使用nlkt库进行分词任务和词性还原任务时遇到了一些问题,在这里做一些记录

解决办法

尝试使用图中所给的:
import nltk
nltk.download
这种方法在我这里不行,报错如下


转点另一种方法,访问github上提供的nltk_data( nltk_data)
这里如果将整个包全部下载下来会很大,比较耗时

我选择了根据报错,也就是attempted to load后面所跟的路径文件夹进行相对应的下载。

包存放位置

上面报错的信息一般都会给出相应的存放位置。这里我选择的是在anaconda虚拟环境下新建文件夹nltk_data中进行存放,
这里记住图2黄色路径的第一个文件夹名字,根据不同的报错信息,文件名有所不同。贴一张图片

一般将所有报错的包补充安装好就没问题了

关于NLTK中tokenizers的问题相关推荐

  1. r与python自然语言处理_Python自然语言处理实践: 在NLTK中使用斯坦福中文分词器 | 我爱自然语言处理...

    斯坦福大学自然语言处理组是世界知名的NLP研究小组,他们提供了一系列开源的Java文本分析工具,包括分词器(Word Segmenter),词性标注工具(Part-Of-Speech Tagger), ...

  2. nltk 中的 sents 和 words

    nltk 中的 sents 和 words ,为后续处理做准备. #!/usr/bin/env python # -*- coding: utf-8 -*-from nltk.corpus impor ...

  3. python语法详解_关于python:NLTK中解析的英语语法

    是否有可以立即使用并可以在NLTK中使用的即用型英语语法? 我搜索了使用NLTK进行解析的示例,但似乎我必须在解析句子之前手动指定语法. 非常感谢! 您可以看一下pyStatParser,这是一个简单 ...

  4. python中pos是什么_如何在NLTK中使用pos_标记?

    所以我试着在列表中标记一堆单词(确切地说是POS标记)如下:pos = [nltk.pos_tag(i,tagset='universal') for i in lw] 其中lw是一个单词列表(它确实 ...

  5. NLP之路-实验nltk中的raw 和 words

     为了实验首先在nltk_data中建立了一个实验文本文件,如下: 文字内容是: hello this is a test sentence. this is the second line ha ...

  6. 中文停用词文档_使用Python中的NLTK和spaCy删除停用词与文本标准化

    译者 | VK 来源 | Analytics Vidhya [磐创AI 导读]:本文介绍了如何使用Python中的NLTK和spaCy删除停用词与文本标准化,欢迎大家转发.留言.想要更多电子杂志的机器 ...

  7. python自然语言分析 何翠仪_如何用 Python 中的 NLTK 对中文进行分析和处理?

    最近正在用nltk 对中文网络商品评论进行褒贬情感分类,计算评论的信息熵(entropy).互信息(point mutual information)和困惑值(perplexity)等(不过这些概念我 ...

  8. [转载] 使用Python中的NLTK和spaCy删除停用词与文本标准化

    参考链接: Python | 用NLTK进行词干分析 概述 了解如何在Python中删除停用词与文本标准化,这些是自然语言处理的基本技术  探索不同的方法来删除停用词,以及讨论文本标准化技术,如词干化 ...

  9. nltk词性标注与词形还原中的词性类型匹配

    一.两函数词性不匹配问题: nltk中词性标注函数nltk.pos_tag([])得到的结果:NN,NNP,VB等 nltk中词形还原函数nltk.stem.WordNetLemmatizer().l ...

最新文章

  1. 基于点云描述子的立体视觉里程计快速鲁棒的位置识别方法
  2. 避免沦为“人工智障”,机器人还需找对语音交互的“打开方式”
  3. 亚信科技CTO欧阳晔博士:5G网络助推边缘AI|MEET 2022
  4. 组合数取模 Lucas定理
  5. GPT转MBR怎么转?GPT转MBR完整图文教程
  6. keepalived+haproxy(双主)+nginx(静态)+lamp(动态)部署phpBB
  7. excel未完全加载怎么办_你知道如何改变Excel的打开姿势吗?
  8. java 静态类的实现_[Java教程]Javascript 静态类的实现
  9. 粽子SHOP-粽子商城官网-一款简洁大气的官网源码
  10. 12.15 Ext JS 选人组件
  11. NFC身份证识别(一)
  12. 数据库中的case when ,if ,if null
  13. SE5边缘计算盒子学习笔记-week1
  14. 开启Apache一直出现443端口被占用
  15. android模拟器 vt,逍遥安卓模拟器VT模式如何设置?VT模式设置流程图文分享
  16. OCR图片转文字两种python方法实现
  17. 美通企业日报 | Gap在华门店总数突破200家;千禧一代环游世界的愿望超过买房...
  18. CSS中使盒子移动方法总结
  19. Aspose.Cells Excel删除行
  20. 大学生学科竞赛管理网站系统、学科竞赛管理系统

热门文章

  1. 三问联通:不能挣钱,拥抱互联网有用吗?
  2. 什么是面向对象和面向过程?
  3. 方舟服务器内存优化,方舟生存进化188.1版更新内容 彻底解决服务端内存溢出问题...
  4. 牛客网华为机考试题(1)
  5. android atan2,Android - Math.atan2的问题
  6. 怎么获取到已经上架宝贝的淘宝新开店铺链接
  7. 算法面试题汇总 leetcode
  8. 网页转应用?一句命令将网页打包成exe
  9. 谜一般的设计模式:工厂方法模式和抽象工厂模式
  10. 徐新:京东是所投最成功的案子