An object of the present invention is to provide an image processing device that can reduce the burden of giving pixel information to a user and can extract a region with high accuracy. An image processing apparatus according to the present invention assigns a plurality of pixels in two-dimensional image data forming first three-dimensional image data including an object to a first class group by a learned classifier. First classifying means for classifying, based on the classification result by the first classifying means, a plurality of pixels in the second three-dimensional image data including the object, at least one of the first class group. Second classifying means for classifying into a second class group including a class. [Selection diagram]【課題】 本発明は、ユーザによる画素情報を与える負担を軽減し、高精度に領域を抽出することのできる画像処理装置を提供することを目的とする。【解決手段】 本発明に係る画像処理装置は、対象物を含む第一の三次元画像データを構成する二次元画像データにおける複数の画素を、学習された分類器により、第一のクラス群に分類する第一の分類手段と、前記第一の分類手段による分類結果に基づいて、前記対象物を含む第二の三次元画像データにおける複数の画素を、前記第一のクラス群の少なくとも一つのクラスを含む第二のクラス群に分類する第二の分類手段と、を有する。【選択図】 図1