technisch eindeutig möglich
Amazons Alexa kann anhand von Tippgeräuschen PIN-Codes entziffern

Britische Computerwissenschafter demonstrierten in einem Experiment, wie einfach man Buchstaben und Zahlen entschlüsseln kann.

Adrian Lobe
Drucken
Teilen
Bei Ipads funktioniert der Trick noch besser als bei Smartphones.

Bei Ipads funktioniert der Trick noch besser als bei Smartphones.

Keystone

Stellen Sie sich vor, Sie sitzen zu Hause auf dem Sofa und machen eine Onlineüberweisung. Während Sie auf Ihrem Smartphone oder Tablet die Zugangsdaten zu Ihrem Onlinekonto eingeben, zeichnet das Mikrofon in Ihrem Smartphone oder Smart Speaker die Tippgeräusche auf. Am nächsten Tag ist das Konto leergeräumt.

Was nach einem Science-Fiction-Szenario klingt, könnte Realität werden. Computerwissenschafter der University of Cambridge zeigten in einer Studie, wie sich mit Hilfe von Spracherkennungssystemen Smartphone-Geräusche entschlüsseln lassen. Weil weder Google noch Amazon Dritten Zugang zu ihren Audio-Rohdaten ihrer Netzwerklautsprecher Home beziehungsweise Echo gewähren, nutzten die Wissenschafter einen ReSpeaker als Hardware, um Umgebungsgeräusche aufzuzeichnen.

Das runde Gerät kommt mit seinen sechs Mikrofonen Amazon Echo recht nahe. Die Probanden sollten in dem Versuch einen fünfstelligen Code oder ein Wort aus dem englischen Wörterbuch auf drei verschiedenen Geräten abtippen: auf zwei Smartphones sowie einem Tablet.

Wenn jemand auf einem Display tippt, erzeugt das kleine Schallwellen, die man messen kann. Doch woher wussten die Forscher, welche Zeichen die Probanden in ihre Geräte eingaben?

Mit Hilfe einer komplexen Audiosignalverarbeitungstechnik konnten die Cambridge-Forscher den Druckbereich beziehungsweise die Schallquelle auf dem Display exakt lokalisieren. Je nachdem, ob der Nutzer oben, in der Mitte oder unten auf das Display drückt, ist die Schallwelle länger oder kürzer unterwegs.

Das sind nur Zentimeter, zuweilen auch nur Millimeter, doch mit entsprechenden Messinstrumenten lassen sich diese Unterschiede feststellen. Und aus diesen unterschiedlichen Distanzen lässt sich eine Wahrscheinlichkeit ableiten, ob der Nutzer bei der PIN-Abfrage auf die 1 links unten im Zahlenfeld oder auf die 9 rechts oben gedrückt hat.

Mit den Schallwellen lassen sich die Winkel berechnen

«Das Problem, das wir lösen, ist überhaupt nicht schwer», erklärt Studienleiter Ilia Shumailov auf Anfrage:

«Man muss herausfinden, wann der Tastendruck stattfindet, wo die relative Position der Taste ist und wie die Ausrichtung des Smartphones ist.»

Moderne Sprachassistenten verfügen über zwei bis sieben Richtstrahlmikrofone, was bedeute, dass man wie bei der Triangulation aus jedem Winkel sehr präzise Positionsdaten bekommen könne.

Mit den Daten trainierten die Informatiker schliesslich einen Machine-Learning-Algorithmus, der eine Wahrscheinlichkeit von Zahlen und Buchstaben errechnete. Bei den Smartphones konnten die Informatiker einen fünfstelligen Code mit einer Wahrscheinlichkeit von bis zu 40 Prozent im ersten Versuch entziffern. Beim Tablet, wo die Abstände zwischen den Zeichen und damit auch die Schalldistanz grösser ist, war die Genauigkeit höher. Damit haben die Forscher bewiesen, dass man nicht nur physische, sondern auch virtuelle Tastaturen ausspionieren kann.

Aktuelle Nachrichten