失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > 微博舆情分析

微博舆情分析

时间:2024-02-28 10:13:33

相关推荐

微博舆情分析

微博是从暑假做的,前前后后经历了3个月,从需求分析到最终在学校上线,算是数据挖掘和大数据的启蒙项目了。记得当时Team所有人都处于理论学习刚出师的阶段,所以就选择了当时研究微博比较火的几个方向:热点话题发现、特定话题情感分析,社交网络发现这几个功能,由于时间的问题,最终只完成了前面两个,但是其中在NLP、特征提取、数据挖掘算法和数据分析流程等方面确实学到了很多。借着这个机会,好好总结一下:

项目流程

首先讲一下整个项目的流程吧,大致分为下面几个步骤:

数据获取语料库构建自然语言处理特征值计算空间向量模型构建热点话题发现 与 特定话题情感分析

核心技术点

下面再说说每一模块用到了一些技术点:

自然语言处理

分词LTP语义分析特征值计算方法

文本频数DF互信息 MI信息增益 IG卡方检验 CHI文本证据权 WET期望交叉熵 ECE热点话题发现

SinglePassKNN话题热度计算LDA主题模型特定话题情感分析

VSI极性调整VBS分析主题词词性

后续会陆续更新文章具体介绍每个步骤是怎么做的。。

如果觉得《微博舆情分析》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。