一种垃圾邮件过滤的中文关键词规则生成方法
- 专利权人:
- 华南理工大学;赛尔网络有限公司
- 发明人:
- 张凌,张启华,张晶,徐傲雪,黄康泉
- 申请号:
- CN201810521174.0
- 公开号:
- CN108763449A
- 申请日:
- 2018.05.28
- 申请国别(地区):
- 中国
- 年份:
- 2018
- 代理人:
- 冯炳辉
- 摘要:
- 本发明公开了一种垃圾邮件过滤的中文关键词规则生成方法,该方法主要包括从邮件集中获取关键词候选词、特征提取得到关键词、获取关键词规则触发情况、为关键词规则赋分值四个步骤,对比当前技术,本发明提出的方法改进了关键词特征提取方法,结合词频和文档频率的特征提取方法降低通用词汇的影响,使用神经网络算法计算规则分值,比较遗传算法降低了学习的开销。本发明解决当前中文关键词规则时效性不足,并且能够根据一个特定的用户群体对于垃圾邮件的定义以及提供的邮件数据集生成最符合用户特征的关键词规则。
- 来源网站:
- 中国工程科技知识中心