失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > 利用NLTK进行分句分词

利用NLTK进行分句分词

时间:2020-04-05 00:13:49

相关推荐

利用NLTK进行分句分词

独角兽企业重金招聘Python工程师标准>>>

.输入一个段落,分成句子(Punkt句子分割器)

importnltkimportnltk.datadefsplitSentence(paragraph):tokenizer=nltk.data.load('tokenizers/punkt/english.pickle')sentences=tokenizer.tokenize(paragraph)returnsentencesif__name__=='__main__':printsplitSentence("MynameisTom.Iamaboy.Ilikesoccer!")

结果为['My name is Tom.', 'I am a boy.', 'I like soccer!']

2.输入一个句子,分成词组

fromnltk.tokenizeimportWordPunctTokenizerdefwordtokenizer(sentence):#分段words=WordPunctTokenizer().tokenize(sentence)returnwordsif__name__=='__main__':printwordtokenizer("MynameisTom.")

结果为['My', 'name', 'is', 'Tom', '.']

如果觉得《利用NLTK进行分句分词》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。