This image processing device (301) is equipped with: a display (361); a control unit (350) which is connected to the display; a speech input device (370); and a motion sensor (380). The control unit (350) has: a: an image display part for displaying a three-dimensional medical image on the display; b: a mode selection part for switching, upon recognizing speech input through a speech recognition device (170), the mode of display related to the three-dimensional medical image in response to the speech; and c: a display processing part for changing, upon recognizing via the motion sensor a motion input by an operator, the display of the three-dimensional medical image in response to the motion.L'invention concerne un dispositif de traitement d'image (301) qui comprend : un afficheur (361) ; une unité de commande (350) qui est connectée à l'afficheur ; un dispositif d'entrée vocale (370) ; et un capteur de mouvement (380). L'unité de commande (350) comprend : a : une partie d'affichage d'image pour afficher une image médicale tridimensionnelle sur l'afficheur ; b : une partie de sélection de mode pour commuter, lors de la reconnaissance d'une entrée vocale par l'intermédiaire d'un dispositif de reconnaissance vocale (170), le mode d'affichage lié à l'image médicale tridimensionnelle en réponse à la parole ; et c : une partie de traitement d'affichage pour changer, lors d'une reconnaissance par le capteur de mouvement d'un mouvement entré par un opérateur, l'affichage de l'image médicale tridimensionnelle en réponse au mouvement.この画像処理装置(301)は、ディスプレイ(361)と、そのディスプレイに接続された制御部(350)と、音声入力デバイス(370)と、モーションセンサ(380)とを備える。制御部(350)は、a:前記ディスプレイに3次元医用画像を表示させる画像表示部と、b:前記音声認識デバイス(170)を用いて入力された音声を認識し、それに応じて、前記3次元医用画像の表示に関するモードを切り替えるモード選択部と、c:前記モーションセンサを介して操作者のモーション入力を認識し、それに応じて、前記3次元医用画像の表示を変更する表示処理部と、を有する。