一种用于遗传变异致病性打分的机器学习模型的构建方法
- 专利权人:
- 北京聚道科技有限公司
- 发明人:
- 王玉梅,刘轩竹,王乐珩,李厦戎
- 申请号:
- CN201711476028.2
- 公开号:
- CN108108592A
- 申请日:
- 2017.12.29
- 申请国别(地区):
- 中国
- 年份:
- 2018
- 代理人:
- 张焕亮`曲芳兵
- 摘要:
- 本发明公开一种用于遗传变异致病性打分的机器学习模型的构建方法,包括:A、获取变异数据文件,并将所述文件进行注释;B、根据注释后的信息筛选出每条变异数据的单转录本;C、对筛选后的单转录本中的数据进行数据分类平衡调整;D、对调整后的数据进行初始特征值的筛选;E、筛选后特征值中的非数值特征进行独热编码量化;F、将独热编码量化后的特征值中的缺失值进行填补;G、将填补后的特征值输入到机器学习模型中进行训练,以获取所述致病性机器学习模型。由上,本发明的机器学习模型可以获取高精度、高召回率的打分结果。
- 来源网站:
- 中国工程科技知识中心