A method for processing a sparsely populated data source comprising: retrieving data from a sparsely populated data source whose records comprise at least one unpopulated data field corresponding to a medical measurement; dividing the data into a training data set and a validation data set; analysing the training data set using a non-linear function approximation algorithm to obtain a trained model and measurement prediction protocols for populating unpopulated fields in the training data set; using the measurement prediction protocols to predict data for the unpopulated data fields; analysing the training dataset on the basis of predefined disease conditions in known patient records to form a disease model which predicts a probability of a disease condition; validating the disease model by analysing the validation dataset and determining a validation error; repeating steps to minimise the validation error and predict a probable disease state for each patient record.L'invention concerne un procédé de traitement d'une source de données incomplète, comprenant les étapes suivantes : la récupération de données à partir d'une source de données incomplète dont les dossiers comprennent au moins un champ de données vide correspondant à une mesure médicale ; la division des données en un ensemble de données d'apprentissage et en un ensemble de données de validation ; l'analyse de l'ensemble de données d'apprentissage à l'aide d'un algorithme d'approximation de fonction non linéaire, pour obtenir un modèle entraîné et des protocoles de prédiction de mesure destinés à compléter des champs vides dans l'ensemble de données d'apprentissage ; l'utilisation des protocoles de prédiction de mesure, pour prédire des données destinées aux champs de données vides ; l'analyse de l'ensemble de données d'apprentissage sur la base d'états pathologiques prédéfinis dans des dossiers de patients connus, pour former un modèle de pathologie qui prédit une probabilité d'état pathologique ; la val