您的位置: 首页 > 院士专题 > 专题 > 详情页

华中农业大学提出关联分析Fast3VmrMLM算法

关键词:
来源:
Plant Communications
来源地址:
https://doi.org/10.1016/j.xplc.2025.101385
类型:
学术文献
语种:
英语
原文发布日期:
2025-05-22
摘要:
2025年5月22日,华中农业大学章元明教授团队在Plant Communications杂志在线发表了题为“Fast3VmrMLM: A fast algorithm that integrates genome-wide scanning with machine learning to accelerate gene mining and breeding by design for polygenic traits in large-scale GWAS datasets”的论文。本研究巧妙地将全基因组扫描与机器学习等一系列算法相结合,提出了一种适用于SNP标记、bin和基因单倍型、lncRNA类型以及结构变异数据的关联分析Fast3VmrMLM算法,为高效、快速和大数据关联分析提供复杂性状大规模基因挖掘和育种改良新技术,为转录组、表型组和代谢组关联分析提供新工具。将常规关联分析运行时间从数小时缩短至几分钟,且以廉价的服务器设备(20 CPUs,1 TB)可实现大样本(50万个品种200万标记)或海量标记(500个品种1亿分子标记)等大数据关联分析。利用18K水稻等数据集鉴定的所有已知和候选基因构建了产量相关性状遗传网络,并确定了21个“枢纽”基因,为复杂性状重要基因挖掘和育种改良提供新策略和基因资源。在过去20多年,关联分析就像遗传迷境中的罗盘,指引着科学家探索生物体复杂性状的遗传基础。尽管基于混合模型的全基因组扫描在关联分析中已广泛应用,然而多基因性状的遗传解析以及人类疾病防治和作物产量等性状的育种改良仍然迫切地需要更新的方法,以更快的速度、更低的成本和更大的群体,发掘更多可信新基因。本研究提出了一套“全基因组扫描+机器学习”框架。在全基因组扫描的混合模型中,考虑了加性效应和显性效应并控制它们的多基因遗传背景,从而鉴定更多的潜在关联标记;在选择标记鉴定显著关联标记时,利用了机器学习算法构建多基因性状的复杂遗传网络。这一新框架全面考虑所有遗传效应和多基因遗传背景,并充分发挥机器学习在复杂网络关系建模方面的优势,有效突破传统方法在遗传位点检测中的“视野盲区”。为应对日益涌现的作物学大规模数据集,并实现高效、快速、大样本和低成本的关联分析,新框架巧妙整合了7项算法技术,有效缓解了大数据处理所带来的计算资源压力,将GWAS软件可支持的品种规模由传统方法的数千大幅提升至百万级水平。显著降低了对高端芯片等计算设备的依赖,化解了“算力壁垒”与“卡脖子”难题。该框架为经典遗传分析方法在大数据与 AI 时代的可持续发展提供了强有力的技术支撑。在Monte Carlo模拟研究和水稻真实数据中,新方法比现有方法在显性效应、小等位基因替代效应和稀有频率等位点检测方面优势明显。在UK-Biobank规模的模拟数据(50万个品种100万标记)中,新方法检测到了遗传率低至3‱的QTN。在水稻18K数据集的14个性状关联分析中,Fast3VmrMLM挖掘了211个有分子生物学实验证据的已知基因和384个有多组学证据的候选基因;在玉米NCII数据集7个产量相关性状关联分析中,新方法鉴定到了26个已知基因和24个候选基因。在20个CPUs和1TB内存的廉价服务器运算中,新方法的运行时间和内存消耗显著优于现有的高效关联分析软件;500个品种1亿标记关联分析只用1.17小时和97.65 GB内存;UK-Biobank规模数据关联分析只用5.43小时和120.29Gb内存;18K水稻数据关联分析每性状平均只用3.30小时;1439个水稻品种100余万标记数据集每性状平均只用5.07分钟。为应对泛基因组数据的出现和分子生物学研究的要求,拓展了Fast3VmrMLM-Hap和Fast3VmrMLM-mQTL模块,用于鉴定bin和基因的单倍型、lncRNA类型和结构变异与目标性状的显著关联。在大豆结构变异数据集中,挖掘了2个大豆油分含量已知基因。利用新算法在18K和1439水稻数据集中鉴定的所有产量相关性状已知基因和候选基因,通过机器学习算法检测基因间互作并构建了其遗传网络,鉴定了21个有充分的证据和育种价值的关键基因,为水稻多基因性状遗传改良提供新的基因资源与策略。这是经典遗传分析基因网络为智慧育种 5.0 提供核心基因资源的典型案例。
相关推荐

意 见 箱

匿名:登录

个人用户登录

找回密码

第三方账号登录

忘记密码

个人用户注册

必须为有效邮箱
6~16位数字与字母组合
6~16位数字与字母组合
请输入正确的手机号码

信息补充