StandfordCoreNLP 依存分析Dependency Parse

本文主要是介绍StandfordCoreNLP 依存分析Dependency Parse，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

在对英文进行句子依存分析时，发现全网在结果解读与分析上内容较少，特此补充资料链接供大家参考。

关于句子依存分析的解释较好的文章：

https://geek.digiasset.org/pages/nlp/nlpinfo/nlp-dependency-parsing/

StandfordCoreNLP使用命令与结果：

from stanfordcorenlp import StanfordCoreNLP
nlp = StanfordCoreNLP('stanford-corenlp-full-2018-10-05')
line = 'Mobile communications contributed almost a quarter of our group revenue in 2000.'
ret = nlp.dependency_parse(line)
print(ret)

结果输出为含多个tuple的列表：

[('ROOT', 0, 3), ('compound', 2, 1), ('nsubj', 3, 2), ('advmod', 6, 4), ('det', 6, 5), ('dobj', 3, 6), ('case', 10, 7), ('nmod:poss', 10, 8), ('compound', 10, 9), ('nmod', 6, 10), ('case', 12, 11), ('nmod', 3, 12), ('punct', 3, 13)]

结果解读：

句子里的单词从数字1开始被编码，一直到句尾，元组里的数字代表单词的位置，数字的前后代表依存关系，前面的数字是head，后面的数字是child，代表后者依存于前者。

比如这句话加上标点符号一共有13个元素，所以（‘compound',2,1）说明Mobile communications 是一个复合词，mobile依存于communications。

更多关于dependency parsing的定义完整版参考官方网页：

Universal Dependencies

官方目录导航（持续更新中）

Universal Dependencies

如果想要绘制依存关系图，可以用线上工具，官方网页：

https://corenlp.run/

绘制结果默认为part-of-speech, NER, Basci Dependencies和Enhanced++ Dependencies, 可以根据需要自选可视化结果：

附录：

常用关于dependency parsing的Universal Dependencies速查：

abbrev: abbreviation modifier，缩写

acomp: adjectival complement，形容词的补充；

advcl : adverbial clause modifier，状语从句修饰词

advmod: adverbial modifier状语

agent: agent，代理，一般有by的时候会出现这个

amod: adjectival modifier形容词

appos: appositional modifier,同位词

attr: attributive，属性

aux: auxiliary，非主要动词和助词，如BE,HAVE SHOULD/COULD等到

auxpass: passive auxiliary 被动词

cc: coordination，并列关系，一般取第一个词

ccomp: clausal complement从句补充

complm: complementizer，引导从句的词好重聚中的主要动词

compound：复合词

conj : conjunct，连接两个并列的词。

cop: copula。系动词（如be,seem,appear等），（命题主词与谓词间的）连系

csubj : clausal subject，从主关系

csubjpass: clausal passive subject 主从被动关系

dep: dependent依赖关系

det: determiner决定词，如冠词等

dobj : direct object直接宾语

expl: expletive，主要是抓取there

infmod: infinitival modifier，动词不定式

iobj : indirect object，非直接宾语，也就是所以的间接宾语；

mark: marker，主要出现在有“that” or “whether”“because”, “when”,

mwe: multi-word expression，多个词的表示

neg: negation modifier否定词

nn: noun compound modifier名词组合形式

npadvmod: noun phrase as adverbial modifier名词作状语

nsubj : nominal subject，名词主语

nsubjpass: passive nominal subject，被动的名词主语

num: numeric modifier，数值修饰

number: element of compound number，组合数字

parataxis: parataxis: parataxis，并列关系

partmod: participial modifier动词形式的修饰

pcomp: prepositional complement，介词补充

pobj : object of a preposition，介词的宾语

poss: possession modifier，所有形式，所有格，所属

possessive: possessive modifier，这个表示所有者和那个’S的关系

preconj : preconjunct，常常是出现在 “either”, “both”, “neither”的情况下

predet: predeterminer，前缀决定，常常是表示所有

prep: prepositional modifier

prepc: prepositional clausal modifier

prt: phrasal verb particle，动词短语

punct: punctuation，这个很少见，但是保留下来了，结果当中不会出现这个

purpcl : purpose clause modifier，目的从句

quantmod: quantifier phrase modifier，数量短语

rcmod: relative clause modifier相关关系

ref : referent，指示物，指代

rel : relative

root: root，最重要的词，从它开始，根节点

tmod: temporal modifier

xcomp: open clausal complement

xsubj : controlling subject 掌控者

中心语为谓词

subj — 主语

nsubj — 名词性主语（nominal subject）（同步，建设）

top — 主题（topic）（是，建筑）

npsubj — 被动型主语（nominal passive subject），专指由“被”引导的被动句中的主语，一般是谓词语义上的受事（称作，镍）

csubj — 从句主语（clausal subject），中文不存在

xsubj — x主语，一般是一个主语下面含多个从句（完善，有些）

中心语为谓词或介词

obj — 宾语

dobj — 直接宾语（颁布，文件）

iobj — 间接宾语（indirect object），基本不存在

range — 间接宾语为数量词，又称为与格（成交，元）

pobj — 介词宾语（根据，要求）

lobj — 时间介词（来，近年）

中心语为谓词

comp — 补语

ccomp — 从句补语，一般由两个动词构成，中心语引导后一个动词所在的从句(IP) （出现，纳入）

xcomp — x从句补语（xclausal complement），不存在

acomp — 形容词补语（adjectival complement）

tcomp — 时间补语（temporal complement）（遇到，以前）

lccomp — 位置补语（localizer complement）（占，以上）

这篇关于StandfordCoreNLP 依存分析Dependency Parse的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

StandfordCoreNLP 依存分析Dependency Parse

相关文章

Nginx分布式部署流程分析

Redis中的有序集合zset从使用到原理分析

Redis中的AOF原理及分析

MyBatis Plus大数据量查询慢原因分析及解决

分析 Java Stream 的 peek使用实践与副作用处理方案

MyBatis/MyBatis-Plus同事务循环调用存储过程获取主键重复问题分析及解决

Java中最全最基础的IO流概述和简介案例分析

Android 缓存日志Logcat导出与分析最佳实践

Linux中的HTTPS协议原理分析

MySQL中读写分离方案对比分析与选型建议