基于WordNet以及潜在语义分析的文本分类方法
- 专利权人:
- 北京工业大学
- 发明人:
- 赵旭,李建强,刘璐,许泽文,莫豪文
- 申请号:
- CN201510502389.4
- 公开号:
- CN105045913A
- 申请日:
- 2015.08.14
- 申请国别(地区):
- 中国
- 年份:
- 2015
- 代理人:
- 刘萍
- 摘要:
- 基于WordNet以及潜在语义分析的文本分类方法涉及计算机领域。本发明考虑文本中单词的同义词及上下位词,同义词及上下位词根据相似度增加各自词频,从而减少多词同义对分类的影响。不同于一般方法中对一个特征矩阵以单一方法做特征提取,我们通过对WordNet调用参数的调整获得多个特征矩阵,使用遗传算法(GA)辅助潜在语义分析(LSA)共同完成特征提取,得到更好的特征矩阵,从而提高了分类效果。
- 来源网站:
- 中国工程科技知识中心