The image processing apparatus (301) includes a display (361), a control unit (350) connected to the display, an audio input device (370), and a motion sensor (380). The control unit (350) recognizes a voice input using a: an image display unit that displays a three-dimensional medical image on the display, and b: the voice recognition device (170). A mode selection unit that switches a mode related to display of a three-dimensional medical image, c: a display processing unit that recognizes an operator's motion input via the motion sensor, and changes the display of the three-dimensional medical image accordingly. Haveこの画像処理装置(301)は、ディスプレイ(361)と、そのディスプレイに接続された制御部(350)と、音声入力デバイス(370)と、モーションセンサ(380)とを備える。制御部(350)は、a:前記ディスプレイに3次元医用画像を表示させる画像表示部と、b:前記音声認識デバイス(170)を用いて入力された音声を認識し、それに応じて、前記3次元医用画像の表示に関するモードを切り替えるモード選択部と、c:前記モーションセンサを介して操作者のモーション入力を認識し、それに応じて、前記3次元医用画像の表示を変更する表示処理部と、を有する。