Video von Chips-Tüte lässt Gespräche rekonstruieren
Alexander Trust, den 7. August 2014Mit einem Video einer Chips-Tüte lassen sich Gespräche rekonstruieren. Gelungen ist dies Wissenschaftlern vom MIT und Forschern von Adobe und Microsoft.
Forscher vom MIT, Adobe und Microsoft haben einen Algorithmus entwickelt, der es erlaubt Audio zu rekonstruieren, indem man Video-Daten ohne Ton analysiert. Eines der Untersuchungsoobjekte war eine Chips-Tüte, die es erlaubte Gesprächsinformationen zu rekonstruieren.
Chips-Tüte verrät Gespräch
Konkret wurde der Gesang von „Marry had a little Lamb“ in einem schalldichten Raum rekonstruiert. Dazu genutzt hat man Videoaufnahmen, die mit einer Kamera außerhalb des Raums hinter einer schalldichten Glasscheibe entstanden sind. Die Kamera stand mehr als viereinhalb Meter von der Chips-Tüte entfernt.
Möglich ist dies, da die Schallwellen das Objekt, in dem Fall die Chips-Tüte für das menschliche Auge unmerklich verändern. Die Mikrovibrationen, die dadurch an verschiedenen Objekten erzeugt werden, werden mitgefilmt und später analysiert.
Der Algorithmus schließlich vergleicht Veränderungen grafischer Natur in benachbarten Pixeln von aufeinanderfolgenden Einzelbildern. In der Praxis mussten die Forscher jedoch Aufnahmen mit 2000 bis 6000 Bildern pro Sekunde aufnehmen, um adäquate Informationen rekonstruieren zu können. Ein erstes YouTube-Video erklärt, wie die Mikrovibrationen auf Pflanzenblättern oder der ominösen Chips-Tüte genutzt wurden, um Audio zu rekonstruieren.
Die NSA hört mit
Der Verdacht liegt auf der Hand, dass in absehbarer Zukunft die Geheimdienste diese Technologie zu ihren Gunsten nutzen könnten. Abe Davis, Student der Elektrotechnik am MIT, und der Hauptautor eines Papers zu diesem Thema, versucht gegenüber der Washington Post das Risiko herunterzuspielen. Denn die Methodik hätte ihre Grenzen und sei (derzeit) nicht besser als andere Methoden zur Rekonstruktion von Audio. Außerdem sei es nicht „mal eben so“ möglich, Gespräche mitzuhören.
„Big brother won’t be able to hear anything that anyone ever says all of a sudden.“
Abe Davis
Dass man getrost weiter Chips wird essen können, ist aber nur eine Frage der Zeit. Denn es haben schon viele helle Köpfe in der Vergangenheit Grenzen formuliert, die sich wegen des technologischen Fortschritts selbst überholt haben. Entsprechend wird man sicherlich eine Methode wie diese so weit optimieren, dass sie entsprechende Ad-hoc-Anwendungen erlaubt, um Gespräche zu rekonstruieren.
Otto Normal sammelt Gesprächs-Informationen
Man könnte, geht aus dem Beitrag der Washington Post hervor, aber schon mit handelsüblichen Digitalkameras, die es erlauben, 60 Bilder pro Sekunde aufzuzeichnen und der Anwendung des von Davis und anderen entwickelten Algorithmus Informationen über Gespräche extrahieren. Das liegt unter anderem an einem Fehler, den diese Kameras bei der Aufnahme produzieren, der sich Rolling-Shutter-Effekt nennt.
Auf diesem Level sei es möglich z. B. zu erkennen, ob sich an einem Ort Männer oder Frauen aufgehalten haben, oder gleich mehrere Personen. Positiv seien Informationen wie diese natürlich für die kriminologische Forensik, um Verbrechen aufzuklären, gibt Davis zu.
Die Ergebnisse wollen die Forscher noch diesen Monat auf der SIGGRAPH 2014 in Vancouver einer breiteren Öffentlichkeit vorstellen. Dann wird die Audio-Rekonstruktion anhand eines Videos der Chips-Tüte wieder thematisiert.
Update vom 19.06.2022: Dieser Beitrag enthielt ein YouTube-Video, das es heute so nicht mehr gibt. Deshalb haben wir es entfernt.