您的位置:
首页
>
农业专利
>
详情页
一种文本特征词提取方法及系统
- 专利权人:
- 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司
- 发明人:
- 殷俊
- 申请号:
- CN201510230545.6
- 公开号:
- CN104809229A
- 申请日:
- 2015.05.07
- 申请国别(地区):
- 中国
- 年份:
- 2015
- 代理人:
- 金玺
- 摘要:
- 本发明公开一种文本特征词提取方法及系统,方法包括:从预设的训练集中提取出多个候选特征词组合,以一个染色体表示一个特征词组合,生成包括多个染色体的初始种群;适应度计算步骤,包括:对当代种群中的每个所述染色体,计算每个所述染色体所表示的特征词组合对于预设的测试集的测试结果作为染色体的适应度,如果当代种群满足预设的输出条件,则根据预设的输出规则,输出当代种群所包括的染色体所表示的特征词组合作为用于文本分析的输出特征词组合,否则执行交叉操作和执行变异操作后得到下一代种群,执行适应度计算步骤。本发明实现了基于遗传算法实现特征词的提取,可以获取比传统特征选择算法更加准确的特征词组合。
- 来源网站:
- 中国工程科技知识中心
- 来源网址:
- http://www.ckcest.cn/home/