失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > python统计中文字数_使用Python计算.pdf文档中的总字数

python统计中文字数_使用Python计算.pdf文档中的总字数

时间:2021-01-01 01:47:37

相关推荐

python统计中文字数_使用Python计算.pdf文档中的总字数

你试过textract吗?i、 电子邮箱:import textract, re

text = textract.process("sample.pdf") # http://www.africau.edu/images/default/sample.pdf

words = re.findall(r"[^\W_]+", text, re.MULTILINE) # regex demo and explanation - /r/U7WMSA/1

print(len(words))

print(words)

# 177

# ['A', 'Simple', 'PDF', 'File', 'This', 'is', 'a', 'small', 'demonstration', 'pdf', 'file', 'just', 'for', 'use', 'in', 'the', 'Virtual', 'Mechanics', 'tutorials', 'More', 'text', 'And', 'more', 'text', 'And', 'more', 'text', 'And', 'more', 'text', 'And', 'more', 'text', 'And', 'more', 'text', 'text', 'And', 'more', 'more', 'text', 'And', 'And', 'more', 'text', 'And', 'more', 'text', 'And', 'more', 'text', 'And', 'more', 'text', 'And', 'more', 'text', 'Boring', 'zzzzz', 'And', 'more', 'text', 'And', 'more', 'text', 'And', 'more', 'text', 'And', 'more', 'text', 'And', 'more', 'text', 'And', 'more', 'text', 'And', 'more', 'text', 'And', 'more', 'text', 'And', 'more', 'text', 'And', 'more', 'text', 'And', 'more', 'text', 'And', 'more', 'text', 'And', 'more', 'text', 'And', 'more', 'text', 'Even', 'more', 'Continued', 'on', 'page', '2', 'Simple', 'PDF', 'File', '2', 'continued', 'from', 'page', '1', 'Yet', 'more', 'text', 'And', 'more', 'text', 'And', 'more', 'text', 'And', 'more', 'text', 'And', 'more', 'text', 'And', 'more', 'text', 'And', 'more', 'text', 'And', 'more', 'text', 'Oh', 'how', 'boring', 'typing', 'this', 'stuff', 'But', 'not', 'as', 'boring', 'as', 'watching', 'paint', 'dry', 'And', 'more', 'text', 'And', 'more', 'text', 'And', 'more', 'text', 'And', 'more', 'text', 'Boring', 'More', 'a', 'little', 'more', 'text', 'The', 'end', 'and', 'just', 'as', 'well']

如果觉得《python统计中文字数_使用Python计算.pdf文档中的总字数》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。