Systems and methods for image-based guidance using automated instrument tracking. An en face image frame, generated from en face image data captured by a first imaging system (e.g., an SER imaging system), is analyzed to determine a location of an instrument in the first imaging plane. A control signal is then generated for the movement stage to control the scanning movement of a depth-based imaging system (e.g., an OCT imaging system) based on the determined location of the instrument. In some implementations, a trained neural-network is used to determine the location of the instrument based on the en face image frame and, in some implementations, the control signal adjusts the speed of the scanning movement to capture image data at a higher density7 at areas corresponding to the determined location of the instrument.La présente invention concerne des systèmes et des procédés de guidage à base d'image utilisant le suivi automatisé d'instrument. Une trame d'image de visage, générée à partir de données d'image de visage capturées par un premier système d'imagerie (par exemple, un système d'imagerie SER), est analysée pour déterminer un emplacement d'un instrument dans le premier plan d'imagerie. Un signal de commande est ensuite généré pour le stade de mouvement afin de commander le mouvement de balayage d'un système d'imagerie basé sur la profondeur (par exemple, un système d'imagerie TCO) sur la base de l'emplacement déterminé de l'instrument. Dans certains modes de réalisation, un réseau neuronal formé est utilisé pour déterminer l'emplacement de l'instrument sur la base de la trame d'image de visage et, dans certains modes de réalisation, le signal de commande ajuste la vitesse du mouvement de balayage pour capturer les données d'image à une densité supérieure au niveau de zones correspondant à l'emplacement déterminé de l'instrument.