Described is a disease prediction system using open source data. The system includes a preprocessing module, a learning module, and a prediction module. The preprocessing module receives a dataset of N trend results related to a disease event and generates an enhanced filter signal (EFS) curve related to the disease event. The learning module receives the EFS curve and generates a predicted number of cases of the disease e vent and, using a plurality of machine learning methods, generates a plurality of predictions that the disease event will happen within a future time period. The prediction module determines precision and recall for each of the plurality of predictions and, based on the precision and recall, provides a likelihood that the disease event will occur.Linvention concerne un système de prédiction de maladie utilisant des données de source ouverte. Le système comprend un module de prétraitement, un module dapprentissage et un module de prédiction. Le module de prétraitement reçoit un ensemble de données de N résultats de tendance liés à un événement de maladie et produit une courbe de signal de filtre amélioré (EFS) se rapportant à lévénement de maladie. Le module dapprentissage reçoit la courbe EFS et produit un nombre prédit de cas de lévénement de maladie et, à laide dune pluralité de procédés dapprentissage machine, produit une pluralité de prédictions relatives à lapparition de la maladie dans une période de temps future. Le module de prédiction détermine la précision et le rappel pour chaque prédiction de la pluralité de prédictions et, daprès la précision et le rappel, présente une probabilité que lévénement de maladie va se produire.