基于LDA主题模型的中医药数据挖掘方法
- 专利权人:
- 浙江大学
- 发明人:
- 姜晓红,严海明,商任翔,吴朝晖,陈英芝
- 申请号:
- CN201310276021.1
- 公开号:
- CN103365978B
- 申请日:
- 2013.07.01
- 申请国别(地区):
- 中国
- 年份:
- 2017
- 代理人:
- 应圣义
- 摘要:
- 本发明涉及中医药信息检索领域,公开了一种基于LDA主题模型的中医药数据挖掘方法,包括以下具体步骤:1)先在LDA模型中确定处方‑主题和主题‑药剂两组先验,处方‑主题和主题‑药剂分别由超参数α和β确定,使用AS方式对两组先验进行先验假设;2)确定LDA模型中的主题数目;3)采用Gibbs采样方法对上述LDA模型进行求解;4)生成LDA模型的语义RDF文档,将LDA模型的结果映射至四元组,并用语义RDF文档进行表示;5)将药剂和处方进行关联,建立处方‑主题‑药剂的可视化结构网络G。本发明的优点在于,适用于海量中药处方的处理和挖掘,并可以得到可视化的结构模型。
- 来源网站:
- 中国工程科技知识中心