您的位置:
首页
>
院士专题
>
专题
> 详情页
加州大学开发蛋白质组学新算法moPepGen
- 关键词:
- 来源:
- Nature Biotechnology
- 全文链接:
- //agri.nais.net.cn/topic/downloadFile/f053554a-35f4-4f8a-8d58-be13bdecdb5e
- 来源地址:
- https://www.nature.com/articles/s41587-025-02701-0
- 资源所属:
- 农业生物技术专题
- 类型:
- 学术文献
- 语种:
- 英语
- 原文发布日期:
- 2025-06-16
- 摘要:
- 2025年6月16日,加州大学洛杉矶分校的研究团队在《Nature Biotechnology》上发表题为“Identification of non-canonical peptides with moPepGen”的研究论文,介绍了一种名为moPepGen的基于图的算法,该算法能够全面生成非典型肽段,并在多种技术、多个物种以及所有类型的遗传和转录组数据中应用,能够在人类癌症蛋白质组中识别出由生殖系和体细胞基因组变异、非编码开放阅读框、RNA融合和RNA环化产生的以前无法观察到的非典型肽段。蛋白质组学领域的一个挑战是模拟基因表达的复杂性,传统的蛋白质鉴定方法主要依赖于参考数据库,这些数据库通常不包含非典型肽段,而非典型肽段可能来源于基因组变异、转录后修饰、RNA编辑、选择性剪接等过程,尽管近年来蛋白质组学技术取得了进展,但由于计算成本高、假阴性率高以及数据解释和变异鉴定困难,传统的非典型肽段检测策略存在局限性。moPepGen算法通过三个图(转录变体图TVG、肽变体图PVG和肽切割图PCG)来整合变异、进行体外翻译和肽切割,从而系统地遍历每种变异组合,该算法能够处理所有三种阅读框架,以有效捕获移码变异,并促进三框开放阅读框搜索,此外,moPepGen还能够处理替代剪接事件、转录融合和RNA环化等复杂情况。研究团队通过一系列实验验证了moPepGen的准确性和效率,首先使用1,000,000次模糊测试迭代来验证moPepGen,将其生成的非典型肽段与基于穷举法的算法进行比较,结果显示moPepGen具有完美的准确性和线性运行时间复杂度,其次将moPepGen与其他两种流行的自定义数据库生成器进行比较,发现moPepGen在预测包含多种变异类型的肽段方面更为敏感,并且能够检测到其他方法无法检测到的肽段,在人类癌症细胞系的蛋白质组中,moPepGen能够从376个细胞系中生成包含体细胞单核苷酸变异、小插入和缺失以及转录融合的非典型肽段数据库,在匹配的蛋白质组数据中,moPepGen能够检测到更多的非典型肽段,这些肽段主要来源于非编码转录本的开放阅读框,此外,moPepGen还能够检测到由RNA编辑、转录融合和选择性剪接产生的变异肽段。moPepGen是一种计算效率高的算法,能够在任意变异类型下枚举转录组和蛋白质组的多样性,能够跨物种、蛋白酶和技术检测变异和新开放阅读框肽段,可以整合到现有的蛋白质分析工作流程中,并广泛增强许多应用中的蛋白质组学分析,研究团队展示了moPepGen在多个领域的应用,包括在人类癌症细胞系中检测体细胞变异产生的非典型肽段,在小鼠C57BL/6N品系中检测生殖系变异产生的非典型肽段,在人类前列腺癌样本中检测由多种基因表达调控层产生的非典型肽段,包括生殖系单核苷酸多态性、选择性剪接事件和circRNA回剪接,在数据独立采集(DIA)质谱中检测非典型肽段,这些应用实例证明了moPepGen在蛋白质组学研究中的广泛适用性和强大的功能,为未来的蛋白质组学研究提供了一个强大的工具。
- 所属专题:
- 64