基于遗传和环境相关的结直肠癌数据模型的分析方法
- 专利权人:
- 西南大学
- 发明人:
- 章乐,郑纯秋,李甜,周紫垣,陈霸东,邢磊,李婷婷
- 申请号:
- CN201610953314.2
- 公开号:
- CN107066781A
- 申请日:
- 2016.11.03
- 申请国别(地区):
- 中国
- 年份:
- 2017
- 代理人:
- 张仲波
- 摘要:
- 本发明提供了一种基于遗传和环境相关的结直肠癌数据模型的分析方法,包括:接收参考人群的指定特征类型的结直肠癌(CRC)数据;对所述数据进行预处理,得到标准化数据;基于标准化数据,对数据进行分类;对每个子类使用稀疏主成分分析和/或信息熵法和/或Relief方法进行特征选择;使用维恩图获取三种方法的交集,使用U检验得到有显著性差异的特征;将特征基因数据样本集分成测试样本和训练样本,根据训练样本得到训练后分类器,将测试样本注入训练后分类器,对测试样本进行特征分类,并统计分类器的分类准确性。本发明实施例可以提高提取致癌因子的准确性,提高分类准确率。
- 来源网站:
- 中国工程科技知识中心