基于遗传算法从大规模高维数据中检测离群数据的方法
- 专利权人:
- 浪潮电子信息产业股份有限公司
- 发明人:
- 韦鹏,付兴旺,吴楠
- 申请号:
- CN201410689745.3
- 公开号:
- CN104408116A
- 申请日:
- 2014.11.26
- 申请国别(地区):
- 中国
- 年份:
- 2015
- 代理人:
- 姜明
- 摘要:
- 本发明公开了一种基于遗传算法从大规模高维数据中检测离群数据的方法,属于离群数据挖掘技术领域,包括如下步骤:(1)样本离散化及编码:将高维数据进行编码,每一个个体对应一个字符串;选择稀疏系数作为适应度函数,由该系数作为判定个体优劣的标准;(2)循环迭代:维护一个群体,群体包括若干个体;通过交叉、变异、选择按照优胜劣汰的原则不断的更新这个群体;(3)译码得到离群数据:将最终获得的群体进行译码对应相应的样本数据,进而发现隐藏在其中的离群数据。本发明可以高效快速的从大规模高维数据中发现隐藏在其中的离群数据。
- 来源网站:
- 中国工程科技知识中心