An image processing apparatus or the like capable of accurately determining whether or not an area in which a subject is in a specific state is included in an image with respect to an image acquired by imaging the inside of a living body with high accuracy by simple arithmetic processing and the like I will provide a. What is claimed is: 1. An image processing apparatus that performs image processing based on image data representing an image of a subject output from an imaging unit and distance data representing a distance to a subject, the image processing apparatus comprising: A depth image generating section (337) for calculating a depth, a subject distance calculating section (336) for calculating a subject distance between the imaging section and the subject based on the image data, a depth image generating section (337) (338) that calculates a difference between the depth calculated by the depth calculating unit (336) and the subject distance calculated by the subject distance calculating unit (336), and a difference calculating unit (338) that calculates, based on the difference calculated by the difference calculating unit (338) And a discrimination unit (339) for discriminating whether or not a region in which the surface of the subject is in a specific state is included.生体内を撮像することにより取得された画像に対し、被写体が特定の状態にある領域が画像内に含まれるか否かの判別を、簡素な演算処理で精度良く行うことができる画像処理装置等を提供する。撮像部から出力された被写体の像を表す画像データ及び被写体までの距離を表す測距データに基づいて画像処理を行う画像処理装置であって、測距データに基づいて、撮像部から被写体までの深度を算出する深度画像作成部(337)と、画像データに基づいて、撮像部と被写体との間の被写体距離を算出する被写体距離算出部(336)と、深度画像作成部(337)が算出した深度と被写体距離算出部(336)が算出した被写体距離との差分を算出する差分算出部(338)と、差分算出部(338)が算出した差分に基づいて、被写体が写った画像に、被写体の表面が特定の状態にある領域が含まれるか否かを判別する判別部(339)と、を備える。