According to embodiments of the present invention, a tongue image extracting apparatus for extracting a region of interest corresponding to a tongue from a face image is provided. The tongue image extracting apparatus includes an image obtaining unit that obtains a first face image including a tongue of a subject and a second face image that does not include a tongue of the subject, An image processing unit for extracting a region of interest corresponding to a tongue of a person in a face image, and an interface for providing a description or an example for guiding the subject to tongue to be tilted or to be closed.본 발명의 실시예들에 따르면, 얼굴 영상으로부터 혀에 대응되는 관심 영역을 추출하는 혀 영상 추출 장치가 제공된다. 혀 영상 추출 장치는 대상자의 혀가 포함된 제1 얼굴 영상과 대상자의 혀가 포함되지 않은 제2 얼굴 영상을 획득하는 영상 획득부, 제1 얼굴 영상과 제2 얼굴 영상의 픽셀 차이에 기초하여 제1 얼굴 영상 중 대상자의 혀에 대응되는 관심 영역을 추출하는 영상 처리부, 및 대상자에게 혀를 내밀도록 유도하거나 입을 다물도록 유도하는 설명 또는 예시를 제공하는 인터페이스를 포함한다.