The image processing apparatus 3 sequentially receives first to nth frame images (n is an integer of 2 or more) sequentially based on a moving image, and roughly extracts a lung field region using a template to perform rough extraction. By performing the processing, the coarse extraction determination unit 130 that sequentially determines the first to nth coarse extraction regions in the first to nth frame images, and the precision of the lung field region from the first to nth coarse extraction regions A precise extraction determination unit 140 that sequentially determines the first to n-th precise extraction regions in the first to n-th frame images by performing the extraction process, and the i-th frame image (2 ≦ i ≦ n The template used in the rough extraction process of any integer) is dynamically changed based on the result of the rough extraction process or the precise extraction process of the (i-1) th frame image. Thereby, when extracting a target area region from a moving image, the improvement of extraction accuracy is implement achieved efficiently.画像処理装置3では、動画像に基づく時間的に連続した第1~第nのフレーム画像(nは2以上の整数)を順次受け、テンプレートを用いて、肺野領域を粗く抽出して粗抽出処理を行うことで、第1~第nのフレーム画像における第1~第nの粗抽出領域を順次決定する粗抽出決定部130と、第1~第nの粗抽出領域から肺野領域の精密抽出処理を行うことで、第1~第nのフレーム画像における第1~第nの精密抽出領域を順次決定する精密抽出決定部140とを備え、第iのフレーム画像(2≦i≦nの何れかの整数)の粗抽出処理で用いられるテンプレートが第(i-1)のフレーム画像の粗抽出処理結果又は精密抽出処理結果に基づいて動的に変更される。これにより、動画像から対象領域を抽出する際、効率的に抽出精度の向上を実現する。