In this image processing device (3), temporally continuous first through n-th frame images (n being an integer two or greater) based on video images are sequentially received, there being provided: a rough extraction determination unit (130) for sequentially determining first through n-th rough extraction regions in the first through n-th frame images by rough-extracting a lung field region and carrying out a rough extraction process using a template and a precise extraction determination unit (140) for sequentially determining a first through n-th precise extraction region in the first through n-th frame images by carrying out a precise extraction process of the lung field region from the first through n-th rough extraction regions. The template used in the rough extraction process of an i-th frame image (any integer where 2 ≤ i ≤ n) is dynamically modified on the basis of the rough extraction process result or precise extraction process result of the (i-1)-th frame image. This efficiently enhances the precision of extraction when a target region is being extracted from video images.Linvention concerne un dispositif (3) de traitement dimage, dans lequel des première à nième images de trames contigües dans le temps (n étant un entier égal ou supérieur à deux) provenant dimages vidéo, sont reçues de façon séquentielle. Le dispositif comprend : une unité (130) de détermination dextraction brute, destinée à déterminer de façon séquentielle des première à nième régions dextraction brutes dans les première à nième images de trames, par lextraction brute dune région de domaine pulmonaire, et à réaliser un processus dextraction brute à laide dun modèle et une unité (140) de détermination dextraction précise destinée à déterminer, de façon séquentielle, des première à nième régions dextraction précise dans les première à nième images de trames, par la réalisation dun processus dextraction précise dans la région de domaine pulmonaire, à partir des première à nième régions d