失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > NLP 英文词性标注

NLP 英文词性标注

时间:2023-04-21 23:56:46

相关推荐

NLP 英文词性标注

一、环境配置

1.下载官网的NLP相关包

将下载下来的stanford-corenlp-full--02-27解压并将下载英文的jar文件

stanford-english-corenlp--02-27-models.jar放到该目录下。

网址:

Stanford CoreNLP - Natural language software​stanfordnlp.github.io/CoreNLP/index.html正在上传…重新上传取消​

下载标红的两个

2.确保电脑里要已经安装java环境

3.在Python中安装stanfordcorenlp

使用pip安装stanfordcorenlp:

pip install stanfordcorenlp

二、在Python环境下调用stanfordcorenlp

from stanfordcorenlp import StanfordCoreNLPimport nltkfrom nltk.tree import Tree as nltkTree

##读取stanford-corenlp所在的目录nlp = StanfordCoreNLP(r'F:\stanford-corenlp-full--02-27')

输入句子

sentence = 'Video becomes a new way of communication between Internet users with the proliferation of sensor-rich mobile devices.'

print('Part of Speech:', nlp.pos_tag(sentence))

标注结果:

三、查看词性标注

在浏览器中访问:http://localhost:9000/

四、中文NLP句子分析

将下载下来的stanford-corenlp-full--02-27解压并将下载英文的jar文件

stanford-chinese-corenlp--02-27-models.jar放到该目录下。

from stanfordcorenlp import StanfordCoreNLPimport nltkfrom nltk.tree import Tree as nltkTree

nlp = StanfordCoreNLP(r'D:\stanfordnlp\stanford-corenlp', lang='zh')

再输入句子

五、附录

ROOT:要处理文本的语句IP:简单从句NP:名词短语VP:动词短语PU:断句符,通常是句号、问号、感叹号等标点符号LCP:方位词短语PP:介词短语CP:由‘的’构成的表示修饰性关系的短语DNP:由‘的’构成的表示所属关系的短语ADVP:副词短语ADJP:形容词短语DP:限定词短语QP:量词短语NN:常用名词NR:固有名词NT:时间名词PN:代词VV:动词VC:是CC:表示连词VE:有VA:表语形容词AS:内容标记(如:了)VRD:动补复合词CD: 表示基数词DT: determiner 表示限定词EX: existential there 存在句FW: foreign word 外来词IN: preposition or conjunction, subordinating 介词或从属连词JJ: adjective or numeral, ordinal 形容词或序数词JJR: adjective, comparative 形容词比较级JJS: adjective, superlative 形容词最高级LS: list item marker 列表标识MD: modal auxiliary 情态助动词PDT: pre-determiner 前位限定词POS: genitive marker 所有格标记PRP: pronoun, personal 人称代词RB: adverb 副词RBR: adverb, comparative 副词比较级RBS: adverb, superlative 副词最高级RP: particle 小品词 SYM: symbol 符号TO:”to” as preposition or infinitive marker 作为介词或不定式标记 WDT: WH-determiner WH限定词WP: WH-pronoun WH代词WP$: WH-pronoun, possessive WH所有格代词WRB:Wh-adverb WH副词关系表示abbrev: abbreviation modifier,缩写acomp: adjectival complement,形容词的补充;advcl : adverbial clause modifier,状语从句修饰词advmod: adverbial modifier状语agent: agent,代理,一般有by的时候会出现这个amod: adjectival modifier形容词appos: appositional modifier,同位词attr: attributive,属性aux: auxiliary,非主要动词和助词,如BE,HAVE SHOULD/COULD等到auxpass: passive auxiliary 被动词cc: coordination,并列关系,一般取第一个词ccomp: clausal complement从句补充complm: complementizer,引导从句的词好重聚中的主要动词conj : conjunct,连接两个并列的词。cop: copula。系动词(如be,seem,appear等),(命题主词与谓词间的)连系csubj : clausal subject,从主关系csubjpass: clausal passive subject 主从被动关系dep: dependent依赖关系det: determiner决定词,如冠词等dobj : direct object直接宾语expl: expletive,主要是抓取thereinfmod: infinitival modifier,动词不定式iobj : indirect object,非直接宾语,也就是所以的间接宾语;mark: marker,主要出现在有“that” or “whether”“because”, “when”,mwe: multi-word expression,多个词的表示neg: negation modifier否定词nn: noun compound modifier名词组合形式npadvmod: noun phrase as adverbial modifier名词作状语nsubj : nominal subject,名词主语nsubjpass: passive nominal subject,被动的名词主语num: numeric modifier,数值修饰number: element of compound number,组合数字parataxis: parataxis: parataxis,并列关系partmod: participial modifier动词形式的修饰pcomp: prepositional complement,介词补充pobj : object of a preposition,介词的宾语poss: possession modifier,所有形式,所有格,所属possessive: possessive modifier,这个表示所有者和那个’S的关系preconj : preconjunct,常常是出现在 “either”, “both”, “neither”的情况下predet: predeterminer,前缀决定,常常是表示所有prep: prepositional modifierprepc: prepositional clausal modifierprt: phrasal verb particle,动词短语punct: punctuation,这个很少见,但是保留下来了,结果当中不会出现这个purpcl : purpose clause modifier,目的从句quantmod: quantifier phrase modifier,数量短语rcmod: relative clause modifier相关关系ref : referent,指示物,指代rel : relativeroot: root,最重要的词,从它开始,根节点tmod: temporal modifierxcomp: open clausal complementxsubj : controlling subject 掌控者中心语为谓词subj — 主语nsubj — 名词性主语(nominal subject) (同步,建设)top — 主题(topic) (是,建筑)npsubj — 被动型主语(nominal passive subject),专指由“被”引导的被动句中的主语,一般是谓词语义上的受事 (称作,镍)csubj — 从句主语(clausal subject),中文不存在xsubj — x主语,一般是一个主语下面含多个从句 (完善,有些)中心语为谓词或介词 obj — 宾语dobj — 直接宾语 (颁布,文件)iobj — 间接宾语(indirect object),基本不存在range — 间接宾语为数量词,又称为与格 (成交,元)pobj — 介词宾语 (根据,要求)lobj — 时间介词 (来,近年)中心语为谓词comp — 补语ccomp — 从句补语,一般由两个动词构成,中心语引导后一个动词所在的从句(IP) (出现,纳入)xcomp — x从句补语(xclausal complement),不存在 acomp — 形容词补语(adjectival complement)tcomp — 时间补语(temporal complement) (遇到,以前)lccomp — 位置补语(localizer complement) (占,以上)— 结果补语(resultative complement)中心语为名词mod — 修饰语(modifier)pass — 被动修饰(passive)tmod — 时间修饰(temporal modifier)rcmod — 关系从句修饰(relative clause modifier) (问题,遇到)numod — 数量修饰(numeric modifier) (规定,若干)ornmod — 序数修饰(numeric modifier)clf — 类别修饰(classifier modifier) (文件,件)nmod — 复合名词修饰(noun compound modifier) (浦东,上海)amod — 形容词修饰(adjetive modifier) (情况,新)advmod — 副词修饰(adverbial modifier) (做到,基本)vmod — 动词修饰(verb modifier,participle modifier)prnmod — 插入词修饰(parenthetical modifier)neg — 不定修饰(negative modifier) (遇到,不)det — 限定词修饰(determiner modifier) (活动,这些)possm — 所属标记(possessive marker),NPposs — 所属修饰(possessive modifier),NPdvpm — DVP标记(dvp marker),DVP (简单,的)dvpmod — DVP修饰(dvp modifier),DVP (采取,简单)assm — 关联标记(associative marker),DNP (开发,的)assmod — 关联修饰(associative modifier),NP|QP (教训,特区)prep — 介词修饰(prepositional modifier) NP|VP|IP(采取,对)clmod — 从句修饰(clause modifier) (因为,开始)plmod — 介词性地点修饰(prepositional localizer modifier) (在,上)asp — 时态标词(aspect marker) (做到,了)partmod– 分词修饰(participial modifier) 不存在etc — 等关系(etc) (办法,等)中心语为实词conj — 联合(conjunct)cop — 系动(copula) 双指助动词????cc — 连接(coordination),指中心词与连词 (开发,与)其它attr — 属性关系 (是,工程)cordmod– 并列联合动词(coordinated verb compound) (颁布,实行)mmod — 情态动词(modal verb) (得到,能)ba — 把字关系tclaus — 时间从句 (以后,积累)— semantic dependentcpm — 补语化成分(complementizer),一般指“的”引导的CP (振兴,的)

如果觉得《NLP 英文词性标注》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。
相关阅读
NLP --- 词性标注

NLP --- 词性标注

2024-03-29

NLP算法-词性标注

NLP算法-词性标注

2019-09-21

NLP-词性标注

NLP-词性标注

2021-03-04

NLP - 词性标注(tagging)

NLP - 词性标注(tagging)

2019-09-08