Von einer Bilderfassungseinrichtung (1) wird ein Basisbild (B1) erfasst und an eine Recheneinheit (4) übermittelt. Von der Recheneinheit (4) wird anhand des Basisbildes (B1) eine Geste (G) eines Benutzers (5) der Recheneinheit (4) ermittelt. Von der Recheneinheit (4) wird in Abhängigkeit von der ermittelten Geste (G) eine Aktion (A) ermittelt und ausgeführt. Die Aktion (A) wird von der Recheneinheit (4) für mindestens eine der Gesten (G) zusätzlich in Abhängigkeit von einer Relativlage (pR13) der Bilderfassungseinrichtung (1) relativ zu einer Anzeigeeinrichtung (3) ermittelt. Spätestens beim Erfassen des Basisbildes (B1) wird von mindestens einer weiteren Bilderfassungseinrichtung (2) ein Zusatzbild (B2) erfasst und an die Recheneinheit (4) übermittelt. Von der Recheneinheit (4) wird anhand des Zusatzbildes (B2) die Relativlage (pR13) der Bilderfassungseinrichtung (1) relativ zur Anzeigeeinrichtung (3) ermittelt.A base image (B1) is captured by an image capturing device (1) and transmitted to a computing unit (4). The computing unit (4) uses the base image (B1) to determine a gesture (G) by a user (5) of the computing unit (4). An action (A) is determined and executed by the computing unit (4) depending on the determined gesture (G). The action (A) is determined by the computing unit (4) for at least one of the gestures (G) additionally as a function of a relative position (pR13) of the image capture device (1) relative to a display device (3). An additional image (B2) is captured by at least one further image capturing device (2) and transmitted to the computing unit (4) at the latest when the base image (B1) is captured. The computing unit (4) uses the additional image (B2) to determine the relative position (pR13) of the image capture device (1) relative to the display device (3).