基于主题遗传的在线主题建模方法
- 专利权人:
- 四川大学
- 发明人:
- 陈兴蜀,何建云,王文贤,杜敏
- 申请号:
- CN201410016179.X
- 公开号:
- CN103793478B
- 申请日:
- 2014.01.14
- 申请国别(地区):
- 中国
- 年份:
- 2017
- 代理人:
- 卓仲阳
- 摘要:
- 本发明公开了一种基于主题遗传的在线主题建模方法,包括抓取当前时间片文本数据,按照LDA模型进行主题建模,计算主题强度,主题排名,计算主题的遗传因子,抓取下一个时间片文本数据,转换主题‑单词分布向量,计算下一个时间片Dirichlet分布先验参数,采用Gibbs采样方法进行主题建模等步骤。本发明的有益效果在于:1、本发明是一种在线主题模型,适合处理时序文本流,可以较好地应用在舆情监控系统中;2、本发明在保留OLDA模型主题对齐特性的同时,根据主题强度为各个主题设置不同的遗传因子,改善了主题混合和新主题不易及时检测的缺陷;3、本发明的主题强度计算方法能够有效降低宽泛主题的得分。
- 来源网站:
- 中国工程科技知识中心