The invention relates to a portable system that allows blind or visually impaired persons to interpret the surrounding environment by sound or touch, said system comprising: two cameras (3i, 3d) separate from one another and configured to capture an image of the environment simultaneously, and means (4i, 4d) for generating sound and/or touch output signals. Advantageously, the system also comprises processing means (2) connected to the cameras (3i, 3d) and to the means (4i, 4d) for generating sound and/or touch signals. The processing means are configured to combine the images captured in real time and to process the information associated with at least one vertical band with information relating to the depth of the elements in the combined image, said processing means (2) also being configured to: divide the vertical band into one or more regions; define a sound or touch signal, in each region, according to the depth of the region and the height of the region; and define a sound or touch output signal based on the sound or touch signals in each region of the vertical band.La presente invención se refiere a un sistema portátil de interpretación sonora o táctil del entorno para personas invidentes o con deficiencias visuales, que comprende: dos cámaras (3i, 3d), separadas entre sí, configuradas para captar simultáneamente una imagen del entorno, y unos medios de generación (4i, 4d) de señales sonoras y/o táctiles de salida. Ventajosamente, el sistema comprende, adicionalmente, unos medios de procesamiento (2) conectados a las cámaras (3i, 3d) y a los medios de generación (4i, 4d) de señales sonoras y/o táctiles, configurados para combinar las imágenes captadas en tiempo real, y para procesar la información asociada a, al menos una franja vertical con información sobre la profundidad de los elementos de la imagen combinada, donde dichos medios de procesamiento (2) están además configurados para dividir la franja vertical en una o más regiones; para definir, en cada re