A first image generated by shooting a subject using light of a first wavelength, a second image generated by shooting a subject using light of a second wavelength, Based on the depth information, an acquisition unit that acquires depth information, a detection unit that detects a face appearing in the second image, and whether or not the face detected by the detection unit is a photograph of a living body And an extraction unit that extracts a face image from the first image based on information about the face that the determination unit has determined to have taken a living body.第1の波長の光を用いて被写体を撮影することで生成された第1の画像と、第2の波長の光を用いて被写体を撮影することで生成された第2の画像と、被写体の深度情報と、を取得する取得部と、第2の画像に写る顔を検出する検出部と、深度情報に基づいて、検出部が検出した顔が生体を撮影したものであるか否かを判定する判定部と、判定部が生体を撮影したものであると判定した顔に関する情報に基づいて、第1の画像から顔画像を抽出する抽出部と、を有する。