PATEL, Sujal M.,MALLICK, Parag,EGERTSON, Jarrett D.
申请号:
USUS2018/067985
公开号:
WO2019/133892A1
申请日:
2018.12.28
申请国别(地区):
US
年份:
2019
代理人:
摘要:
Methods and systems are provided for accurate and efficient identification and quantification of proteins. In an aspect, disclosed herein is a method for identifying a protein in a sample of unknown proteins, comprising receiving information of a plurality of empirical measurements performed on the unknown proteins; comparing the information of empirical measurements against a database comprising a plurality of protein sequences, each protein sequence corresponding to a candidate protein among a plurality of candidate proteins; and for each of one or more of the plurality of candidate proteins, generating a probability that the candidate protein generates the information of empirical measurements, a probability that the plurality of empirical measurements is not observed given that the candidate protein is present in the sample, or a probability that the candidate protein is present in the sample; based on the comparison of the information of empirical measurements against the database.L'invention concerne des méthodes et systèmes pour l'identification et la quantification précises et efficaces de protéines. Selon un de ses aspects, l'invention concerne une méthode permettant d'identifier une protéine donnée au sein d'un échantillon de protéines inconnues, comprenant les étapes suivantes : réception des informations de multiples mesures empiriques réalisées sur les protéines inconnues ; comparaison de ces informations de mesures empiriques à une base de données comprenant de nombreuses séquences protéiques, chaque séquence protéique correspondant à une protéine candidate parmi de multiples protéines candidates ; et, pour chacune d'une ou de plusieurs protéines candidates parmi les nombreuses protéines candidates, calculs de la probabilité que la protéine candidate génère ces informations de mesures empiriques, de la probabilité que les multiples mesures empiriques ne soient pas observées alors que la protéine candidate est présente dans l'échantillon, ou de la proba