您的位置: 首页 > 中文期刊论文 > 详情页

一种融合标签语义的微博热点话题挖掘方法

作   者:
周福星陈秀真马进李生红
作者机构:
上海交通大学网络空间安全学院
关键词:
K-means聚类微博文本隐狄利克雷分布模型标签语义公共块
期刊名称:
计算机工程
i s s n:
1000-3428
年卷期:
2019 年 10 期
页   码:
283-287
摘   要:
由于微博文本的长度较短,直接使用隐狄利克雷分布(LDA)模型会导致特征向量高维稀疏。为此,提出一种融合标签语义的热点话题挖掘方法。利用公共块算法计算微博标签的相似度,合并标签相似度较高的微博文本。采用LDA模型对合并后的文本建模,并通过K-means聚类算法挖掘微博热点话题。实验结果表明,与针对单一微博文本建模的方法以及直接合并相同标签的方法相比,该方法的困惑度较低,挖掘热点话题的准确性较高。
相关作者
载入中,请稍后...
相关机构
    载入中,请稍后...
应用推荐

意 见 箱

匿名:登录

个人用户登录

找回密码

第三方账号登录

忘记密码

个人用户注册

必须为有效邮箱
6~16位数字与字母组合
6~16位数字与字母组合
请输入正确的手机号码

信息补充