一种基于VSM文本分类系统的设计与实现
- 作者机构:
- 华中科技大学计算机科学与技术学院;
- 关键词:
- 特征提取; 结构层次权重系数; 分类算法; 向量空间模型; 训练算法; 文本分类;
- 期刊名称:
- 华中科技大学学报(自然科学版)
- 基金项目:
- i s s n:
- 1000-8616
- 年卷期:
- 2005 年 33 卷 03 期
- 页 码:
- 53-55
- 摘 要:
- 阐述了一个基于改进向量空间模型的中文文本分类系统的设计与实现 ,包括对该系统的结构、预处理、特征提取、训练算法 ,分类算法等关键技术的介绍 .通过引入结构层次权重系数来改进文本特征项权重 ,同时提出一种新的训练算法和文本相似度域值计算方法 .实验结果证明 :该分类系统能有效地提高文本分类效果 ,开放性测试的平均准确率在 80 %以上 ,且平均查全率达到了 86 % .
相关作者
相关机构
