An image processing apparatus, an image processing method, and a program capable of generating a learning sample appropriately reflecting a state in a lumen. The image processing apparatus 1 captures images from a surface shape estimation unit 10 that estimates a surface shape of a target reflected in an intraluminal image of a living body, an imaging viewpoint change unit 11 that changes an imaging viewpoint for the surface shape, and an imaging viewpoint after the change. And an image generation unit 12 that generates a target virtual image.管腔内の状態を適切に反映した学習サンプルを生成することができる画像処理装置、画像処理方法およびプログラムを提供する。画像処理装置1は、生体の管腔内画像に映る対象の表面形状を推定する表面形状推定部10と、表面形状に対する撮像視点を変更する撮像視点変更部11と、変更後の撮像視点から撮像した場合の対象の仮想画像を生成する画像生成部12と、を備える。