A method of medical data auto collection segmentation and analysis, includes collecting, from a plurality of sources, unstructured medical data in a plurality of formats, recognizing a medical name entity of each piece of the unstructured medical data, using a medical dictionary, and performing semantic text segmentation on each piece of the unstructured medical data so that each piece of the unstructured medical data is partitioned into groups sharing a same topic. The method further includes generating, as structured medical data, each piece of the unstructured medical data of which the medical name entity is recognized, each piece of the unstructured medical data being partitioned into the groups, and indexing the structured medical data into elastic search clusters.L'invention concerne un procédé de segmentation et d'analyse de collecte automatique de données médicales consistant à collecter, à partir d'une pluralité de sources, des données médicales non structurées dans une pluralité de formats, à reconnaître une entité de nom médical de chaque élément des données médicales non structurées, à l'aide d'un dictionnaire médical, et à effectuer une segmentation de texte sémantique sur chaque élément des données médicales non structurées de sorte que chaque élément des données médicales non structurées soit divisé en groupes partageant un même thème. Le procédé consiste en outre à générer, sous la forme de données médicales structurées, chaque élément des données médicales non structurées dont l'entité de nom médical est reconnue, chaque élément des données médicales non structurées étant divisé en groupes, et à indexer les données médicales structurées en grappes de recherche élastiques.