一种融合标签语义的微博热点话题挖掘方法
- 作者机构:
- 上海交通大学网络空间安全学院;
- 关键词:
- K-means聚类; 微博文本; 隐狄利克雷分布模型; 标签语义; 公共块;
- 期刊名称:
- 计算机工程
- i s s n:
- 1000-3428
- 年卷期:
- 2019 年 10 期
- 页 码:
- 283-287
- 摘 要:
- 由于微博文本的长度较短,直接使用隐狄利克雷分布(LDA)模型会导致特征向量高维稀疏。为此,提出一种融合标签语义的热点话题挖掘方法。利用公共块算法计算微博标签的相似度,合并标签相似度较高的微博文本。采用LDA模型对合并后的文本建模,并通过K-means聚类算法挖掘微博热点话题。实验结果表明,与针对单一微博文本建模的方法以及直接合并相同标签的方法相比,该方法的困惑度较低,挖掘热点话题的准确性较高。
相关作者
相关机构
