失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > 机器学习聚类分析——k-means文本聚类分析

机器学习聚类分析——k-means文本聚类分析

时间:2023-02-14 18:52:38

相关推荐

机器学习聚类分析——k-means文本聚类分析

最近比较喜欢听《认真的老去》这首歌,那就抓这个豆瓣评论做数据集吧,,做个评论的聚类分析。

一、抓到数据

抓出来140条评论~~

放代码~~

import requests

from bs4 import BeautifulSoup

start_page = 1

end_page = 7

data = []

while start_page <= end_page:

html = BeautifulSoup(requests.get(url=/subject/26979930/comments/hot?p=.format(start_page)).text)

data += [content.text for content in html.find_all(span,{class:short})]

start_page +=1

下面开始我们的聚类分析

文本通过jieba分词,

传递给CountVectorizer,统计出词频。

如果觉得《机器学习聚类分析——k-means文本聚类分析》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。