文本分类模型训练方法、文本分类方法及其装置
- 专利权人:
- 百度在线网络技术(北京)有限公司
- 发明人:
- 张天颜,张翔,饶伟健,兰小丰
- 申请号:
- CN201710692909.1
- 公开号:
- CN107590195A
- 申请日:
- 2017.08.14
- 申请国别(地区):
- 中国
- 年份:
- 2018
- 代理人:
- 陈姗姗
- 摘要:
- 本申请公开了一种文本分类模型训练方法、文本分类方法及其装置,该文本分类模型的训练方法,包括:通过计算训练文本集合中各候选词的词频‑逆文档频率和互信息,筛选出若干特征词;基于各特征词,根据遗传算法训练文本分类模型。根据本申请实施例提供的技术方案,通过计算训练文本集合中各候选词的词频‑逆文档频率和互信息,筛选出若干特征词,能够解决现有技术筛选的特征词准确率低下问题。
- 来源网站:
- 中国工程科技知识中心