Cookie-Einstellungen

Für unseren Service speichern wir Cookies und andere Informationen auf Ihren Geräten und verarbeiten damit einhergehend Ihre personenbezogene Daten bzw. greifen auf solche zu. Manche helfen uns, das Nutzungserlebnis unserer Services zu verbessern, sowie personalisierte Empfehlungen und Werbung auszuspielen. Hierfür bitten wir um Ihre Einwilligung. Darüber hinaus nutzen wir mit Ihrer Einwilligung Technologien zur Datenübermittlung für die Zielgruppenauswahl und die Ausspielung von Werbung bei Partnern. Sie können Ihre Einwilligung jederzeit über die Cookie-Einstellungen, erreichbar über den Link "Cookies" im Footer wie auch unter Ziffer 11 unserer Datenschutzbestimmungen, ändern und widerrufen.

Cookie-Einstellungen

Für unseren Service speichern wir Cookies und andere Informationen auf Ihren Geräten und verarbeiten damit einhergehend Ihre personenbezogene Daten bzw. greifen auf solche zu. Manche helfen uns, das Nutzungserlebnis unserer Services zu verbessern, sowie personalisierte Empfehlungen und Werbung auszuspielen. Hierfür bitten wir um Ihre Einwilligung. Darüber hinaus nutzen wir mit Ihrer Einwilligung Technologien zur Datenübermittlung für die Zielgruppenauswahl und die Ausspielung von Werbung bei Partnern. Sie können Ihre Einwilligung jederzeit über die Cookie-Einstellungen, erreichbar über den Link "Cookies" im Footer wie auch unter Ziffer 11 unserer Datenschutzbestimmungen, ändern und widerrufen.

Deine Privatsphäre Einstellungen

Für unseren Service speichern wir Cookies und andere Informationen auf Ihren Geräten und verarbeiten damit einhergehend Ihre personenbezogene Daten bzw. greifen auf solche zu. Manche helfen uns, das Nutzungserlebnis unserer Services zu verbessern, sowie personalisierte Empfehlungen und Werbung auszuspielen. Hierfür bitten wir um Ihre Einwilligung. Darüber hinaus nutzen wir mit Ihrer Einwilligung Technologien zur Datenübermittlung für die Zielgruppenauswahl und die Ausspielung von Werbung bei Partnern. Sie können Ihre Einwilligung jederzeit über die Cookie-Einstellungen, erreichbar über den Link "Cookies" im Footer wie auch unter Ziffer 11 unserer Datenschutzbestimmungen, ändern und widerrufen.

Diese Cookies und andere Informationen sind für die Funktion unseres Services unbedingt erforderlich. Sie garantieren, dass unser Service sicher und so wie von Ihnen gewünscht funktioniert. Daher kann man sie nicht deaktivieren.

Wir möchten für Sie unseren Service so gut wie möglich machen. Daher verbessern wir unsere Services und Ihr Nutzungserlebnis stetig. Um dies zu tun, möchten wir die Nutzung des Services analysieren und in statistischer Form auswerten

Um unseren Service noch persönlicher zu machen, spielen wir mit Hilfe dieser Cookies und anderer Informationen personalisierte Empfehlungen und Werbung aus und ermöglichen eine Interaktion mit sozialen Netzwerken. Die Cookies werden von uns und unseren Werbepartnern gesetzt. Dies ermöglicht uns und unseren Partnern, den Nutzern unseres Services personalisierte Werbung anzuzeigen, die auf einer website- und geräteübergreifenden Analyse ihres Nutzungsverhaltens basiert. Die mit Hilfe der Cookies erhobenen Daten können von uns und unseren Partnern mit Daten von anderen Websites zusammengeführt werden.

Wenn Sie uns Ihre E-Mail-Adresse zur Verfügung stellen (z.B. in einem Formular), geben wir diese mit Ihrer Einwilligung zur Auswahl von Zielgruppen (Custom Audiences) in pseudonymisierter Form an unsere Partner weiter. Diese ermitteln, ob Sie dort über ein Nutzerkonto verfügen. Wenn dem so ist, wird ihre pseudonymisierte E-Mail-Adresse von unseren Partnern in eine sog. Custom Audience aufgenommen und für die zielgruppenbasierte Ausspielung von Werbung genutzt. Die E-Mail-Adresse wird von unseren Partnern unmittelbar im Anschluss an den Abgleich gelöscht; E-Mails werden nicht verschickt. Weitere Informationen finden Sie unter Zwecke der Datenverarbeitung. Die relevanten Partner finden Sie anhand der ergänzenden Bezeichnung "Custom Audience".

Von der Spracherkennung zum Lippenlesen

Bildquelle: ©Adobe Stock / Text: dpa

Berlin - Das Lippenlesen ist gar nicht so einfach – weder für Mensch noch für Maschine. Doch Wissenschaftler wollen Computern diese Kunst nun beibringen. Erste Erfolge gibt es schon, doch trotz der enormen Weiterentwicklung sind die Programme noch nicht praktikabel.

"Ein solches System könnte für eine ganze Reihe von Anwendungen benutzt werden", sagt Helen Bear von der britischen University of East Anglia. Die Informatikerin und ihr Team haben ein Programm entwickelt, das ihrer Studie zufolge deutlich bessere Ergebnisse als bisherige Ansätze liefert - für eine Anwendung unter realen Bedingungen reicht es aber noch lange nicht.

Feine Unterschiede sorgen für Probleme

Die Krux: Auf den Lippen sehen viele Töne praktisch gleich aus. Computer müssen lernen, die feinen Unterschiede zu interpretieren, die Menschen verborgen bleiben. Dafür braucht es kluges Training. "Die Sprache sieht bei uns allen unterschiedlich aus, also brauchen wir Modelle, die bei jedem funktionieren", sagt Bear.

Schon 1968 beschrieb der Science-Fiction-Klassiker "2001: Odyssee im Weltraum" die Idee: Der Supercomputer HAL 9000 liest im Film heimlich die Lippenbewegungen von Astronauten durch eine Scheibe. Sie hatten sich eingeschlossen, damit er ihre Pläne nicht mitbekommt. "Das zeigt, wie alt das Thema ist", sagt Tanja Schultz, Professorin für Kognitive Systeme an der Universität Bremen.

Auswertung von Bild und Ton

Das klassische Vorgehen: Der Computer identifiziert auf einem Video den Bereich der Lippen. Während der Sprecher redet, nimmt das Programm Aussehen und Abfolge der Bewegung (Viseme) sowie die geäußerten Laute (Phoneme) auf. Im dritten Schritt wird es mit einem statistischen Modell trainiert: Wie hängen Video und Audio zusammen? Diese Lernstrategien sind ein entscheidender Teil der Forschung. "Menschen können durch gutes Training gut Lippen lesen, aber sie sind nicht perfekt", sagt Schultz.

Nicht alle Sprachen sind gleich

Die Laute p, b und m etwa sind auf den Lippen fast nicht zu unterscheiden. Daher braucht das Programm mehr Informationen: Die vorhandenen Wörter einer Sprache schränken die möglichen Phonemketten schon ein. Weitere Hinweise geben erlaubte Satzkonstruktion und Sinn der Aussage. Hilfreich, fast schon unerlässlich: eine Datenbank mit Zusammenhängen von Audio und Text. Ein menschlicher Lippenleser kennt Ausdrücke und Redewendungen seiner Sprache und den Kontext einer Unterhaltung - für Computer ist das schwieriger.

Auch von Sprecher zu Sprecher gibt es große Unterschiede. "Salopp gesagt: Manche kriegen die Zähne nicht auseinander", sagt Schultz. Schon so sollte die Aussprache möglichst deutlich, die Sätze grammatikalisch korrekt und nicht umgangssprachlich sein. "Je spontaner Sprache gesprochen wird, umso schwieriger ist sie zu erkennen." Und: Manche Sprachen sind einfacher als andere. Gut ist eine große Zahl an Konsonanten - Vokale ähneln sich stark. Fatal ist es, wenn die Tonhöhe in der Sprache eine Bedeutung ausmacht.

Allround-Programm

Forscher hoffen: Ein zuverlässiges Programm könnte bei der Aufklärung von Straftaten anhand von Überwachungsvideos helfen, eine bessere Verständigung von sprach- und hörbehinderten Menschen ermöglichen, als digitaler Assistent im Stil von Apples Siri und Microsofts Cortana arbeiten - oder die Identität von Menschen feststellen.

Passwort 2.0

Um Nutzernamen, Geheimwörter und PIN überflüssig zu machen, schlägt Ahmed Hassanat von der jordanischen Mutah-Universität lautlose Passwörter vor: schwer abzufangen und nützlich bei lauter Umgebung. Zur Identifikation am Bankautomaten oder im Online-Shop würde es reichen, allein die Lippen zu bewegen. Nötig wäre nur eine Kamera, kein spezielles Equipment wie etwa für Fingerabdrücke. Experimente zeigten bereits das Potenzial zur praktischen Umsetzung.

Programme noch in den Kinderschuhen

Doch noch erreicht kein Programm eine hohe Trefferquote - erst recht nicht, wenn die getesteten Sprecher einfach drauflosreden. Vielversprechend sei der Einsatz lernfähiger künstlicher Intelligenz, die sich an biologische Vorbilder anlehnt, sagt Schultz. Ein Team um Michael Wand von der Fachhochschule der italienischen Schweiz erreicht mit sogenannten tiefen neuronalen Netzen eine deutlich bessere Worterkennung als mit herkömmlichen Methoden, allerdings bei begrenztem Wortschatz.

Und parallel wird auch an anderen Ansätzen geforscht, die ohne Audio-Signal auskommen: Spracherkennung durch Messung der Muskelaktivität in Gesicht und Hals, Ultraschallbilder der Zunge oder Verfolgung der Hirnaktivität selbst - Schultz zufolge aber eher unpraktisch, da bisher nur am offenen Schädel möglich.