您的位置: 首页 > 院士专题 > 专题 > 详情页

中国科学院深圳先进技术研究院合成生物学研究所研究基于对比学习的酶促反应分类AI模型

关键词:
来源:
中国科学院深圳先进技术研究院
来源地址:
https://www.siat.ac.cn/kyjz2016/202501/t20250124_7522760.html
类型:
前沿资讯
语种:
中文
原文发布日期:
2025-01-24
摘要:
中国科学院深圳先进技术研究院的罗小舟领衔的研究团队,近日在Journal of Cheminformatics期刊发表重要研究成果"CLAIRE: A Contrastive Learning-based Predictor for EC Number of Chemical Reactions"。在该研究成果中,团队利用对比学习,数据扩增,以及基于化学反应预训练模型的特征提取(embedding)策略,构建了一个用于预测EC分类编号的高效人工智能模型(CLAIRE)。作者将CLAIRE与当前最领先的Theia模型进行了对比。Theia是2023年由瑞士洛桑联邦理工学院的科学家Daniel Probst发表在Journal of Cheminformatics期刊上的基于常规深度学习的模型——然而常规深度学习方法不能有效解决数据不平衡的问题。借助对比学习和数据扩增的策略,CLAIRE展现出了优异的性能——在测试集上,CLAIRE比Theia有数倍的准确率提升,且在三级EC分类编号预测之间的一致性也显著高于Theia。此外,作者利用酵母菌的代谢模型构建了另一个大型独立测试集。在该数据集中,CLAIRE的表现也显著高于Theia。通过一系列严格的评估,研究人员展示了CLAIRE的强大能力:在酵母代谢模型中,它成功区分了真实的酶-反应配对与错误配对。代谢模型是生物体内代谢反应的定量化表示,涵盖基因、酶、代谢物及其细胞内分布,广泛应用于代谢工程和通量平衡分析等领域。CLAIRE的加入使得研究人员能够更高效地分析和注释反应网络,为代谢研究提供了全新可能。此外,CLAIRE在逆合成路径规划和药物代谢预测等关键领域展示出巨大应用潜力。逆合成预测旨在推断生成目标化合物所需的原料及反应路径。在这一过程中,多个中间产物可能生成大量候选反应。通过CLAIRE预测的EC编号,可为这些反应分配相关酶,大幅提升最终目标化合物成功合成的可能性。另外,药物在人体内的代谢转化及路径是评估其安全性和有效性的重要环节。通过对潜在反应注释EC编号,CLAIRE能够清晰描绘可能的药物代谢路径,为毒性评估及药物开发提供有力支持。总而言之,该项成果在代谢工程和合成生物学领域中有着广泛的应用。
相关推荐

意 见 箱

匿名:登录

个人用户登录

找回密码

第三方账号登录

忘记密码

个人用户注册

必须为有效邮箱
6~16位数字与字母组合
6~16位数字与字母组合
请输入正确的手机号码

信息补充