Provided are a learning method, an image recognition device, and a program, which are capable of, with respect to a recognition object of which an insufficient number of images to be used for learning exits, realizing highly accurate image recognition. An image recognition device 4 carries out a first learning through a convoluted neural network by using a first image group that has been imaged at a first frame rate inputted from the outside, and then carries out, after the first learning, a second learning by using a second image group that has been imaged at a second frame rate lower than the first frame rate inputted from without, and that has fewer images than the first image group.La présente invention concerne un procédé d'apprentissage, un dispositif de reconnaissance d'image et un programme, qui permettent, en ce qui concerne un objet de reconnaissance duquel un nombre insuffisant d'images devant être utilisées pour l'apprentissage est délivré en sortie, de façon à effectuer une reconnaissance d'image très précise. Un dispositif de reconnaissance d'image 4 effectue un premier apprentissage par l'intermédiaire d'un réseau neuronal convoluté au moyen d'un premier groupe d'images qui a été imagé à une première fréquence de trame entré depuis l'extérieur, puis effectue, après le premier apprentissage, un deuxième apprentissage au moyen d'un deuxième groupe d'images qui a été imagé à une deuxième fréquence de trame inférieure à la première fréquence de trame entré depuis l'extérieur, et qui comporte moins d'images que le premier groupe d'images.学習用画像が不足する認識対象に対して、高精度な画像認識を実現することができる学習方法、画像認識装置およびプログラムを提供する。画像認識装置4は、外部から入力された第1フレームレートによって撮像された第1画像群を用いて前記コンボリューショナルニューラルネットワークによる第1の学習を行い、第1の学習を行った後に、外部から入力された前記第1フレームレートよりも低い第2フレームレートで撮像された第2画像群であって、第1画像群より枚数が少ない第2画像群を用いて第2の学習を行う。