您的位置:
首页
>
农业专利
>
详情页
一种快速准确鉴定高通量基因组数据污染源的方法
- 专利权人:
- 广西作物遗传改良生物技术重点开放实验室
- 发明人:
- 曲俊杰,尹玲,卢江
- 申请号:
- CN201610117589.2
- 公开号:
- CN105740650A
- 申请日:
- 2016.03.02
- 申请国别(地区):
- 中国
- 年份:
- 2016
- 代理人:
- 王正茂
- 摘要:
- 本发明公开了一种快速准确鉴定高通量基因组数据污染源的方法,该方法首先组装denovo测序的原始基因组测序数据,得到组装结果,将组装结果进行基因预测,并翻译得到基因所对应蛋白的氨基酸序列,将组装的基因组序列和氨基酸序列分别与NCBI的NT数据库和NR数据库进行blast比对,得到有同源性的序列,作为原始比对数据库;从原始比对数据库中,提取序列对应的物种信息并排序,将序列对应的物种从多到少进行排序,结合基因数据的结果和氨基酸数据的结果,综合判断是否存在外源污染。本发明的方法可大限度的降低基因组denovo项目中,外来污染源对高通量基因组测序数据的污染和对后续生物信息学分析的影响,并提高污染源鉴定的速度和效率。
- 来源网站:
- 中国工程科技知识中心
- 来源网址:
- http://www.ckcest.cn/home/