In the image generation device, a diagnostic image for generating at least one of a moving image obtained by photographing a predetermined part of a human body or an animal and a temporally continuous image based on the moving image as a diagnostic image for each first time interval An image target setting unit that acquires a first image at a predetermined time and a second image for each second time interval longer than the first time interval from the predetermined time in the diagnostic image. A pixel color conversion unit that converts a color of a pixel that satisfies a predetermined condition among the pixels of the first image and the second image so that the color of the pixel can be identified; A display image generation unit that generates an image for display using the image and the second image. Accordingly, it is possible to accurately capture the amount of state change of the predetermined part on the image from the moving image in which the predetermined part of the human body or animal is photographed.画像生成装置では、人体または動物の所定部位が撮影された動画像及び該動画像に基づく時間的に連続した画像のうち少なくとも一方を第1の時間間隔毎の診断用画像として生成する診断用画像生成部と、該診断用画像において、所定時刻における第1画像と、該所定時刻から該第1の時間間隔よりも長い第2の時間間隔毎の第2画像と、を取得する画像対象設定部と、該第1画像及び該第2画像の画素のうち所定条件を満足する画素の色を識別可能に変換する画素色変換部と、画素色変換部によって画素の色が変換された前記第1画像及び前記第2画像を用いて表示用画像を生成する表示画像生成部と、を備える。これにより、人体または動物の所定部位が撮影された動画像から、所定部位の状態変化の量を画像上で正確に捉えることが可能となる。