The present invention relates to a diagnostic system and a method of operating the same, including a system, for predicting future lung cancer incidence by integrating data collected from different hospitals and providing an early diagnosis service of a disease. The data association-based disease diagnosis method of the present invention obtains a first medical code including at least one diagnosis code from a first data source, and includes at least one diagnosis code from a second data source different from the first data source. Obtaining a second medical code to perform, identifying a reference diagnosis code from among the first medical code and the second medical code, obtaining a first event vector and a second event vector from the first medical code and the second medical code, respectively The step of converting the first event vector and the second event vector into an integrated vector space based on the diagnostic code, and the onset of a patient related to the first medical code and the second medical code based on the integrated vector space and the reference diagnostic code And predicting the probability.본 발명은 시스템을 포함하여 물리적으로 서로 다른 병원에서 수집된 데이터를 통합하여 향후 폐암 발병을 예측하고, 질병의 조기 진단 서비스를 제공하는 진단 시스템 및 그 운용 방법에 관한 것이다. 본 발명의 데이터 연합 기반의 질병 진단 방법은 제1 데이터 소스로부터 적어도 하나의 진단 코드를 포함하는 제1 의료 코드를 획득하고, 제1 데이터 소스와 상이한 제2 데이터 소스로부터 적어도 하나의 진단 코드를 포함하는 제2 의료 코드를 획득하는 단계, 제1 의료 코드 및 제2 의료 코드 중 기준 진단 코드를 식별하는 단계, 제1 의료 코드 및 제2 의료 코드로부터 각각 제1 이벤트 벡터 및 제2 이벤트 벡터를 획득하는 단계, 진단 코드를 기초로 제1 이벤트 벡터 및 제2 이벤트 벡터를 통합 벡터 공간으로 변환하는 단계 및 통합 벡터 공간 및 기준 진단 코드를 기초로 제1 의료 코드 및 제2 의료 코드와 관련된 환자의 발병 확률을 예측하는 단계를 포함한다.