您的位置: 首页 > 中文期刊论文 > 详情页

病原宏基因组测序生物信息学分析流程的性能验证及结果分析

作   者:
习文肖洋杨尚栋刘哲王方王晓琴
作者机构:
西安交通大学第一附属医院检验科
关键词:
生物信息学性能验证宏基因组病原体模拟数据集
期刊名称:
中华检验医学杂志
i s s n:
1009-9158
年卷期:
2025 年 48 卷 001 期
页   码:
117-124
摘   要:
目的初步建立一种临床实验室病原宏基因组测序(mNGS)生物信息学分析流程的性能验证方案。方法模拟三类数据集, 其中CatⅠ数据集(包括CatⅠA和CatⅠB数据集)主要由病原体参考基因组及人源序列组成, CatⅠA数据集为常见病原体以及人源序列数据集, 评估mNGS生物信息学分析流程的阳性一致率、包容性、准确性、召回率、精确率、F1分数等指标;CatⅠB数据集为常见病原体近缘物种以及混合人源序列数据集, 通过计算近缘物种检出和相对丰度比值用于评价生物信息学分析流程的近缘物种鉴别能力;CatⅡ数据集由200例已知结果的临床样本数据构成, 包含定植菌、实验环境菌、试剂工程菌、病原体参考基因组及人源序列数据, 用于评价生信分析流程对病原体检测的敏感度、特异性及准确性;CatⅢ数据集由阴性的肺泡灌洗液样本实测数据中掺入20种罕见病原体序列构建而成的数据集, 用于评价生物信息学分析流程对罕见病原体的阳性检出率和召回率。结果 CatⅠA数据集分析结果表明, 3种序列梯度下的阳性一致率、包容性、精确率和准确性均>99.00%, 召回率为72.31%(95%CI 69.61%~75.01%), F1分数为82.00%(95%CI 79.77%~84.22%)。CatⅠB的近缘物种在全部序列梯度和比例梯度下均可有效检出, 且除冠状病毒、嗜血杆菌属、博卡病毒、人呼吸道合胞病毒、艾美虫属外, 其余近缘物种的相对丰度比值均在设计比例的2倍以内, 具有良好的近缘物种鉴别能力。对CatⅡ数据集包含的24种病原体全部有效检出, 敏感度、特异性、准确性均>90%。CatⅢ数据集中各罕见病原体检出率为100%。结论通过模拟数据集, 初步建立了一种临床实验室mNGS生物信息学分析流程的性能验证方案, 可评估分析流程中序列分类的准确性、近缘物种鉴别能力、常见物种的检出能力、罕见菌的检出能力等, 为mNGS流程的性能验证建设提供一定参考。
相关作者
载入中,请稍后...
相关机构
    载入中,请稍后...
应用推荐

意 见 箱

匿名:登录

个人用户登录

找回密码

第三方账号登录

忘记密码

个人用户注册

必须为有效邮箱
6~16位数字与字母组合
6~16位数字与字母组合
请输入正确的手机号码

信息补充