The present invention provides: a medical image processing apparatus for performing optimal detection of a lesion region according to in-vivo locations in acquired images; an endoscope system; a medical image processing method; and a program. Images are acquired from a medical device that sequentially captures images at a plurality of in-vivo locations in a test subject and displays the images in real time. Position information indicating the in-vivo locations in the acquired images are acquired. Region-of-interest detection units corresponding to the locations indicated by the position information are selected, as region-of-interest detection units for detecting regions of interest from input images, from among a plurality of region-of-interest detection units respectively corresponding to the plurality of in-vivo locations. The regions of interest are detected from the images acquired by the selected region-of-interest detection units.La présente invention concerne : un appareil de traitement d'image médicale pour effectuer une détection optimale d'une région de lésion en fonction d'emplacements in vivo dans des images acquises; un système d'endoscope; un procédé de traitement d'image médicale; et un programme. Des images sont acquises à partir d'un dispositif médical qui capture séquentiellement des images au niveau d'une pluralité d'emplacements in vivo dans un sujet de test et affiche les images en temps réel. Des informations de position indiquant les emplacements in vivo dans les images acquises sont acquises. Des unités de détection de région d'intérêt correspondant aux emplacements indiqués par les informations de position sont sélectionnées, en tant qu'unités de détection de région d'intérêt pour détecter des régions d'intérêt à partir d'images d'entrée, parmi une pluralité d'unités de détection de région d'intérêt correspondant respectivement à la pluralité d'emplacements in vivo. Les régions d'intérêt sont détectées à partir des images acquises par les u