standFord parser 和dependencyparser 使用说明及其符号含义
首先,下载地址
一、简单实例
1、standFord Parser
from nltk.parse.stanford import StanfordParser
import nltk
import osif __name__ == '__main__':nltk.internals.config_java('C:/Program Files/Java/jdk1.8.0_202/bin/java.exe')java_path = "C:/Program Files/Java/jdk1.8.0_202/bin/java.exe"os.environ['JAVAHOME'] = java_pathstanford_parser_dir = 'D:/work/standford_parser/stanford-parser-full-2018-10-17/'eng_model_path = "D:/work/standford_parser/stanford-parser-full-2018-10-17/stanford-parser-3.9.2-models/edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz"my_path_to_models_jar = stanford_parser_dir + "stanford-parser-3.9.2-models.jar"my_path_to_jar = stanford_parser_dir + "stanford-parser.jar"parser = StanfordParser(model_path=eng_model_path, path_to_models_jar=my_path_to_models_jar,path_to_jar=my_path_to_jar)s = list(parser.parse("The President of the United States is Trump".split()))# s = parser.raw_parse(# "the quick brown fox jumps over the lazy dog")for line in s:print("line: ")line.draw()print(line)
2、standFord dependency parser
from nltk.parse.stanford import StanfordDependencyParsereng_parser = StanfordDependencyParser(model_path=eng_model_path, path_to_models_jar=my_path_to_models_jar,path_to_jar=my_path_to_jar)
res = list(eng_parser.parse("The President of the United States is Trump".split()))
# for dic in res[0].nodes():
# print(dic)
print(res[0].root)
print(res[0].nodes)
for row in res[0].nodes:print(row)
二、符号说明
1、standFord parser (短语结构)各符号含义
ROOT:要处理文本的语句
IP:简单从句
NP:名词短语
VP:动词短语
PU:断句符,通常是句号、问号、感叹号等标点符号
LCP:方位词短语
PP:介词短语
CP:由‘的’构成的表示修饰性关系的短语
DNP:由‘的’构成的表示所属关系的短语
ADVP:副词短语
ADJP:形容词短语
DP:限定词短语
QP:量词短语
NN:常用名词
NR:固有名词
NT:时间名词
PN:代词
VV:动词
VC:是
CC:表示连词
VE:有
VA:表语形容词
AS:内容标记(如:了)
VRD:动补复合词
CD: 表示基数词
DT: determiner 表示限定词
EX: existential there 存在句
FW: foreign word 外来词
IN: preposition or conjunction, subordinating 介词或从属连词
JJ: adjective or numeral, ordinal 形容词或序数词
JJR: adjective, comparative 形容词比较级
JJS: adjective, superlative 形容词最高级
LS: list item marker 列表标识
MD: modal auxiliary 情态助动词
PDT: pre-determiner 前位限定词
POS: genitive marker 所有格标记
PRP: pronoun, personal 人称代词
RB: adverb 副词
RBR: adverb, comparative 副词比较级
RBS: adverb, superlative 副词最高级
RP: particle 小品词
SYM: symbol 符号
TO:”to” as preposition or infinitive marker 作为介词或不定式标记
WDT: WH-determiner WH限定词
WP: WH-pronoun WH代词
WP$: WH-pronoun, possessive WH所有格代词
WRB:Wh-adverb WH副词
2、dependencyparser (依存关系)各符号含义
abbrev: abbreviation modifier,缩写
acomp: adjectival complement,形容词的补充;
advcl : adverbial clause modifier,状语从句修饰词
advmod: adverbial modifier状语
agent: agent,代理,一般有by的时候会出现这个
amod: adjectival modifier形容词
appos: appositional modifier,同位词
attr: attributive,属性
aux: auxiliary,非主要动词和助词,如BE,HAVE SHOULD/COULD等到
auxpass: passive auxiliary 被动词
cc: coordination,并列关系,一般取第一个词
ccomp: clausal complement从句补充
complm: complementizer,引导从句的词好重聚中的主要动词
conj : conjunct,连接两个并列的词。
cop: copula。系动词(如be,seem,appear等),(命题主词与谓词间的)连系
csubj : clausal subject,从主关系
csubjpass: clausal passive subject 主从被动关系
dep: dependent依赖关系
det: determiner决定词,如冠词等
dobj : direct object直接宾语
expl: expletive,主要是抓取there
infmod: infinitival modifier,动词不定式
iobj : indirect object,非直接宾语,也就是所以的间接宾语;
mark: marker,主要出现在有“that” or “whether”“because”, “when”,
mwe: multi-word expression,多个词的表示
neg: negation modifier否定词
nn: noun compound modifier名词组合形式
npadvmod: noun phrase as adverbial modifier名词作状语
nsubj : nominal subject,名词主语
nsubjpass: passive nominal subject,被动的名词主语
num: numeric modifier,数值修饰
number: element of compound number,组合数字
parataxis: parataxis: parataxis,并列关系
partmod: participial modifier动词形式的修饰
pcomp: prepositional complement,介词补充
pobj : object of a preposition,介词的宾语
poss: possession modifier,所有形式,所有格,所属
possessive: possessive modifier,这个表示所有者和那个’S的关系
preconj : preconjunct,常常是出现在 “either”, “both”, “neither”的情况下
predet: predeterminer,前缀决定,常常是表示所有
prep: prepositional modifier
prepc: prepositional clausal modifier
prt: phrasal verb particle,动词短语
punct: punctuation,这个很少见,但是保留下来了,结果当中不会出现这个
purpcl : purpose clause modifier,目的从句
quantmod: quantifier phrase modifier,数量短语
rcmod: relative clause modifier相关关系
ref : referent,指示物,指代
rel : relative
root: root,最重要的词,从它开始,根节点
tmod: temporal modifier
xcomp: open clausal complement
xsubj : controlling subject 掌控者
中心语为谓词
subj — 主语
nsubj — 名词性主语(nominal subject) (同步,建设)
top — 主题(topic) (是,建筑)
npsubj — 被动型主语(nominal passive subject),专指由“被”引导的被动句中的主语,一般是谓词语义上的受事 (称作,镍)
csubj — 从句主语(clausal subject),中文不存在
xsubj — x主语,一般是一个主语下面含多个从句 (完善,有些)
中心语为谓词或介词
obj — 宾语
dobj — 直接宾语 (颁布,文件)
iobj — 间接宾语(indirect object),基本不存在
range — 间接宾语为数量词,又称为与格 (成交,元)
pobj — 介词宾语 (根据,要求)
lobj — 时间介词 (来,近年)
中心语为谓词
comp — 补语
ccomp — 从句补语,一般由两个动词构成,中心语引导后一个动词所在的从句(IP) (出现,纳入)
xcomp — x从句补语(xclausal complement),不存在
acomp — 形容词补语(adjectival complement)
tcomp — 时间补语(temporal complement) (遇到,以前)
lccomp — 位置补语(localizer complement) (占,以上)
— 结果补语(resultative complement)
中心语为名词
mod — 修饰语(modifier)
pass — 被动修饰(passive)
tmod — 时间修饰(temporal modifier)
rcmod — 关系从句修饰(relative clause modifier) (问题,遇到)
numod — 数量修饰(numeric modifier) (规定,若干)
ornmod — 序数修饰(numeric modifier)
clf — 类别修饰(classifier modifier) (文件,件)
nmod — 复合名词修饰(noun compound modifier) (浦东,上海) amod — 形容词修饰(adjetive modifier) (情况,新)
advmod — 副词修饰(adverbial modifier) (做到,基本)
vmod — 动词修饰(verb modifier,participle modifier)
prnmod — 插入词修饰(parenthetical modifier)
neg — 不定修饰(negative modifier) (遇到,不)
det — 限定词修饰(determiner modifier) (活动,这些) possm — 所属标记(possessive marker),NP
poss — 所属修饰(possessive modifier),NP
dvpm — DVP标记(dvp marker),DVP (简单,的)
dvpmod — DVP修饰(dvp modifier),DVP (采取,简单)
assm — 关联标记(associative marker),DNP (开发,的)
assmod — 关联修饰(associative modifier),NP|QP (教训,特区) prep — 介词修饰(prepositional modifier) NP|VP|IP(采取,对) clmod — 从句修饰(clause modifier) (因为,开始)
plmod — 介词性地点修饰(prepositional localizer modifier) (在,上) asp — 时态标词(aspect marker) (做到,了)
partmod– 分词修饰(participial modifier) 不存在
etc — 等关系(etc) (办法,等)
中心语为实词
conj — 联合(conjunct)
cop — 系动(copula) 双指助动词????
cc — 连接(coordination),指中心词与连词 (开发,与)
其它
attr — 属性关系 (是,工程)
cordmod– 并列联合动词(coordinated verb compound) (颁布,实行) mmod — 情态动词(modal verb) (得到,能)
ba — 把字关系
tclaus — 时间从句 (以后,积累)
— semantic dependent
cpm — 补语化成分(complementizer),一般指“的”引导的CP (振兴,的)
standFord parser 和dependencyparser 使用说明及其符号含义相关推荐
- c语言符号txt下载,c语言中符号含义.txt
c语言中符号含义.txt char 壺 壨 char ; char 壻 char a; char asd; char xa; float 壺 壨 float ; float 壻 float a; fl ...
- Linux文件权限符号含义
Linux文件权限符号含义 在Linux中,每个文件都有不同的权限.用户可以使用ls -l命令查看权限属性.其中,符号含义如下所示: r:读权限. w:写权限. x:可执行权限. -:没有权限. s: ...
- Apple Watch使用指南:所有Apple Watch图标和符号含义
Apple Watch是iPhone的缩影,具有" n"个功能,苹果为它们制定了各种不同的图标和符号.这篇文章详细总结了所有Apple Watch图标和符号含义,还不了解的朋友快来 ...
- Linux系统命令行的符号含义
内容整理于网络,如有侵权,请告知删除. 1.常见符号含义 . 代表当前目录 .. 代表上一层目录,当前目录的父目录 - 代表前一个目录,我刚才从哪个目录cd过来 ~ 代表当前用户的宿主目录 ...
- Matlab 的符号含义
matlab符号含义 符号意义 MATLAB所定义的特殊变量及其意义变量名 意义 help 在线帮助命令, 如用help plot调用命令函数plot的帮助说明. who 列出所有定义过的变量名称 a ...
- 电容器参数标注方法及材料符号含义!
电容器是由一个导体和另一个导体包围.主要用于储存电力和电能.简单地说,它是一个可以装电的容器.它由两个间隔开且彼此相对的金属板组成,并向金属板施加直流电压.然后电子会迅速转移并聚集在另一块金属板上.广 ...
- R 符号含义与常用数学运算 ∈ R 使用笔记
文章目录 1.常用符号含义 2.常用数学函数 3.常用的统计函数 参考:R语言学习–特殊符号的意义:https://www.jianshu.com/p/76d1cf475827 1.常用符号含义 首先 ...
- uml 菱形_UML类图的各符号含义
UML 类图的各符号含义 类图基本符号可拆分为虚线,箭头,实线,空心右三角,实心右三角,空心菱形和实心菱形.由这些基本 的图形进行组合构成了类图的基本符号.这里要注意这几个符号的顺序,代表了类与类之间 ...
- 计算机语言常用符号含义,符号的含义 - 解析编译原理
其中动作符号的含义如下 @BRF↑label1 :输出 BRF label1, @BR↑label2:输出 BR label2, @SETlabel↓label1:设置标号label1 @SETlab ...
最新文章
- 【Android 安全】DEX 加密 ( Application 替换 | 分析 BroadcastReceiver 组件中调用 getApplication() 获取的 Application )
- Linux服务器集群系统(二)--转
- Linux C : Makefile 的编写和示例
- SAP CRM,C4C和Hybris的product Cockpit
- 算法题目——质量(POJ-1862)
- 描写火车站场景_关于描写火车站的句子
- JAVAWEB入门tomcat服务器配置
- [译]Kube Router Documentation
- 【Matplotlib】【Python】如何使用matplotlib绘制绘制随机生成的点--随机漫步详解
- 基于名字自动化之原理(1)
- C#中自己动手创建一个Web Server(非Socket实现)
- unity编辑器扩展_07(创建对话框,检测按钮的点击,点击按钮后提示信息,保存设置的数据,显示点击按钮后的处理的进度条信息)...
- 小米wifi 苹果驱动安装教程macOS Mojave 10.14,Sierra 10.12测试通过
- ch3 电磁干扰的耦合和传播
- 域名解析中A记录、CNAME、MX记录、NS记录的区别和联系
- 微信小程序授权登录 组件的封装
- Bugku web — ereg正则%00截断(代码审计) ——详细题解
- linux who 时间,linux命令之who、w、whoami
- 在CorelDRAW 2019创建对称绘图模式
- 打印系统开发(27)——WinForm开发(49)——c# winform 打印图像,PrintDialog打印并且设置打印纸张大小
热门文章
- oracle时间开始结束时间,Oracle日期周详解以及周开始结束时间计算
- 艾诺迪亚【八门神器+超级教程】
- 一起来聊聊 IP 地址、局域网、广域网、IPV4 和 IPV6
- 根据关键字选出excel中匹配的数据
- 软件学院研究方向,对研究方向迷茫的同学一定要看(据说是一位北大软院前辈写的)
- 福到啦L1-6 福到了(15 分) “
- google site 网站搜索功能
- BZOJ1026 || 洛谷P2657 [SCOI2009]windy数【数位DP】
- Eudcoder scikit-learn线性回归实践 - 波斯顿房价预测
- 二周第一次课(3月26日)