改进信息增益的维吾尔文特征选择方法
- 作 者:
- 韩军兵; 哈力旦·阿布都热依木; 古力努尔·艾尔肯; 何燕;
- 作者机构:
- 新疆大学电气工程学院;
- 关键词:
- 倒逆转文档频率; 特征选择; 类词频; 文本分类; 信息增益;
- 期刊名称:
- 计算机工程与应用
- i s s n:
- 1002-8331
- 年卷期:
- 2017 年 53 卷 023 期
- 页 码:
- 34-38
- 摘 要:
- 特征选择是维吾尔语文本分类的关键技术,对分类结果将产生直接的影响.为了提高传统信息增益在维吾尔文特征选择中的效果,在深度分析维吾尔文语种特点的基础上,提出了一种新的信息增益特征选择方法.该方法结合类词频和特征分布系数以及倒逆文档频率,对传统信息增益进行修正;引入一个备选特征分布系数来平衡类间选取的特征个数;在维吾尔文数据集上实验验证.实验结果表明,改进的算法对维吾尔文分类效果有明显的提高.
相关作者
相关机构
