NLTK 基本语料库函数
函数 描述
fileids() 语料库中的文件
fileids([categories]) 这些分类对应的语料库中的文件
categories() 语料库中的分类
categories([fileids]) 这些文件对应的语料库中的分类
raw() 语料库的原始内容
raw(fileids=[f1,f2,f3]) 指定文件的原始内容
raw(categories=[c1,c2]) 指定分类的原始内容
words() 整个语料库中的词汇
words(fileids=[f1,f2,f3]) 指定文件中的词汇
words(categories=[c1,c2]) 指定分类中的词汇
sents() 指定分类中的句子
sents(fileids=[f1,f2,f3]) 指定文件中的句子
sents(categories=[c1,c2]) 指定分类中的句子
abspath(fileid) 指定文件在磁盘上的位置
encoding(fileid) 文件的编码(如果知道的话)
open(fileid) 打开指定语料库文件的文件流
root() 到本地安装的语料库根目录的路径
NLTK 基本语料库函数相关推荐
- 在c语言中,函数中的自动变量可以赋初值,每调用一次,赋一次初值,计算机二级考试 程序设计基础试题及答案三...
<程序设计基础>考试试卷三 1. 判断下面标识符中哪个是C语言中合法的用户定义标识符: A. a-b B. #abd C. typedef D. _max 2. -b?在内存中占个字节,& ...
- R语定义函数对宽分布(wide distribution )、有偏分布(skew distribution)的数据进行对数变换(符号对数变换函数、signed log transformation)
R语言自定义函数对宽分布(wide distribution ).有偏分布(skew distribution)的数据进行对数变换(符号对数变换函数.signed log transformation ...
- c语言函数传递坐标值,C语言中,函数间数据传递的方式有三种,即用返回值、参数、全局变量。...
语言中有用返党在过渡时期的总路线之所以实行建设和改造同时并举,原因在于( ). 机械手通常是通用装置,函数回值一种手爪往往只能抓持形状多样.尺寸不同.重量相近的工件. 在气动控制系统中,间数据传气动执 ...
- c语言中“函数的定义不可以嵌套,但函数的调用可以嵌套
楼上正解,可能楼主没理解 我这里具体举例说明不能嵌套定义 即是function a(){ function b(){ }}在a函数里面定义b函数是错的,只能在a函数外部定义b函数 像这样functio ...
- NLTK(1.2)NLTK简介
文章目录 NLTK库简介 NLTK库重要模块及功能 安装NLTK库 NLTK中的语料库 英文文本语料库 标注文本语料库 其他语言的语料库 文本语料库常见结构 NLTK 中定义的基本语料库函数 加载自己 ...
- python nlp_【NLP】Python NLTK获取文本语料和词汇资源
作者:白宁超 2016年11月7日13:15:24 摘要:NLTK是由宾夕法尼亚大学计算机和信息科学使用python语言实现的一种自然语言工具包,其收集的大量公开数据集.模型上提供了全面.易用的接口, ...
- 《用Python进行自然语言处理》第2章 获得文本语料和词汇资源
1. 什么是有用的文本语料和词汇资源,我们如何使用 Python 获取它们? 2. 哪些 Python 结构最适合这项工作? 3. 编写 Python 代码时我们如何避免重复的工作? 2.1 获取文本 ...
- python的基本文本处理操作
基本文本的处理 基本文本的处理 语料库 nltk的基本语料库函数 nltk语料库的导入 文本的词汇多样性 词频统计 utf8和unicode的python实现 python读取本地文件 练习 正则表达 ...
- Python自然语言处理 | 获得文本语料与词汇资源
本章解决问题- 什么是有用的文本语料和词汇资源,我们如何使用Python获取它们? 哪些Python结构最适合这项工作? 编写Python代码时我们如何避免重复的工作? 这里写目录标题 1获取文本语料 ...
最新文章
- 【GLib】GLib学习笔记(二):源码编译
- 近些年有哪些口碑炸裂的项目管理工具?各具特色的项目管理工具我们该如何选择?
- ​计算产业如何加速突破?鲲鹏开发者技术沙龙带来新答案
- 搞怪菜鸟加入域全程图解[为企业部署Windows Server 2008系列十二]
- cuda 5.0配置vs2008+Visual Assist X +安装问题解决
- idea部署springboot项目到外部tomcat
- 【转】C#中的命名空间namespace全解
- Linux Shell数值比较和字符串比较及相关
- 整数区间内整数的因子的个数
- java下面哪些定义正确_Java认证考试题
- 怎么完全卸载赛门铁克_symantec卸载方法
- MIPI归纳---为什么阻抗为100欧姆
- ZOJ 3703 	Happy Programming Contest 0-1背包 DP
- 计算机、通信方向学习考证经验分享
- Unity3D基础案例-双人坦克
- 五年级上册计算机教学工作计划,小学五年级上册信息技术教学工作计划(精选5篇)...
- 项目__网页版聊天室
- Linux下安装oracle的脚本,linux系统oracle数据安装配置脚本
- 解决Safari浏览器下载文件文件名称乱码的问题
- K8S日志挂载到本机