您的位置:
首页
>
院士专题
>
专题
> 详情页
河南大学开发植物代谢组学数据分析流程:MetMiner
- 关键词:
- 来源:
- JIPB
- 全文链接:
- //agri.nais.net.cn/topic/downloadFile/c53e64ce-45bf-4c65-8825-2634ea4b083e
- 来源地址:
- https://doi.org/10.1111/jipb.13774
- 资源所属:
- 农业生物技术专题
- 类型:
- 学术文献
- 语种:
- 英语
- 原文发布日期:
- 2024-09-10
- 摘要:
- 2024年年9月10日,JIPB在线发表了河南大学张学斌团队题为“MetMiner: A user-friendly pipeline for large-scale plant metabolomics data analysis”的论文,介绍了一款用户友好的,专为大规模植物代谢组学数据处理及数据挖掘打造的分析流程MetMiner。MetMiner分析流程由三部分构成:第一部分为上游数据处理,第二部分为下游数据分析,第三部分为进阶数据挖掘。整体基于R-shiny开发,具有用户友好的、交互性强的图形界面,通过数据上传、参数选择等简单步骤即可完成完整的植物代谢组学数据分析及数据挖掘工作。上游数据处理目的在于将LC-MS原始数据经过数据清洗、标准化等过程转换为可以用于下游统计分析的干净数据。该部分调用了tidyMass framwork (Shen et al. 2022), 先进的质谱数据存储和管理方式确保了MetMiner可以从不同类型的质谱数据开始分析,同时也保证了数据分析的透明性、可追溯性以及可重复性。下游数据分析包括了代谢物的注释、分类、基础统计分析以及富集分析,该研究针对性的开发了代谢组下游分析工具包 (MDAtoolkits)。MDAtoolkits内置了六个植物特异的MS2代谢物数据库以及三个MS1代谢物数据库,保证了植物代谢组学代谢物注释的准确性。此外,MDAtoolkits集成了多元统计分析和单元统计分析来快速鉴定差异代谢物,并基于ClassyFire数据库和KEGG数据库开发了代谢物分类富集分析和通路富集分析来帮助用户解析差异代谢物潜在的生物学功能。 对于复杂的代谢组学实验设计,标志代谢物的挖掘工作相对困难,本研究提出了迭代WGCNA的策略,通过多轮WGCNA将无法聚类的代谢物逐步排除,最终将具有相同积累规律的代谢物归类到不同的模块,构建代谢物共积累网络。通过对模块的通路富集分析、分类富集分析以及枢纽代谢物 (hub metabolite) 提取,快速锁定标志代谢物。MetMiner可以通过Shiny Server部署在高性能服务器或者计算集群,调用更多的计算资源来实现对大样本量的代谢组学数据分析。此外,MetMiner的设计理念充分考虑了流程的“易用性”和“交互性”。“Resuming analysis from the unfinished steps”功能使用户可以随时继续未完成的分析,或者选择性的针对特定步骤进行重新分析。“Interactive plot”提供了强大的图表数据交互能力,使用户直接从图片中获取相应信息。例如图2中,通过点击差异分析火山图中代表差异代谢物的点,该代谢物的统计分析结果、代谢物注释、MS2 spactra以及化学结构图会相应的显示。简化了用户对数据提取操作,提升了数据分析及信息获取的效率。最后,该研究通过MetMiner流程对206份拟南芥F-box突变体群体拟靶代谢组学数据进行了深度解析,快速锁定了标志代谢物硫代葡萄糖苷 (glucoraphanin) 和芥子酰苹果酸 (sinapoyl malate) 并且通过靶向检测验证了MAX2突变导致硫代葡萄糖苷增加,KFB20突变导致芥子酰苹果酸的增加,该结果也说明了MetMiner在群体规模代谢组学数据挖掘中的准确性和高效性。此外,经MetMiner处理的不同质谱平台产生的非靶代谢组学数据在代谢物定性及定量的方面展现出高度的一致性,这说明MetMiner在代谢物注释方面具有较高的稳健性。
- 所属专题:
- 64