Aktuelle Nachrichten & Meldungen

Facebook: Neuronales Netzwerk beschreibt Fotos für Blinde

Gepostet am Apr 5, 2016

Sehgeschädigte Facebook-Nutzer können sich von speziellen Programmen vorlesen lassen, was auf ihrem Bildschirm geschrieben steht. Künftig können sie sich auch beschreiben lassen, was auf Fotos in ihrem Newsfeed zu sehen ist. Automatic Alternative Text (AAT) heißt die neue Funktion, die Facebook gerade eingeführt hat. Automatic, weil sie nicht auf manueller Verschlagwortung der Bilder beruht, sondern auf einem selbstlernenden neuronalen Netzwerk.

Zum Entwicklerteam gehört Matt King, Facebooks erster blinder Ingenieur. Im Gespräch mit TechCrunch sagte er: „So vieles in unserem Newsfeed ist visuell, und häufig kommentieren Menschen ein Foto oder schreiben etwas dazu, wenn sie es hochladen. Aber sie schreiben nicht, was eigentlich auf dem Foto abgebildet ist. Für Menschen wie mich stellt sich dann immer die Frage, was eigentlich gerade Sache ist, worüber gerade diskutiert wird.“

AAT soll Abhilfe schaffen. Anfangs funktioniert das Tool nur mit Apples Betriebssystem iOS, nur in den USA, Großbritannien, Kanada, Australien und Neuseeland und nur in englischer Sprache. Nutzer müssen die VoiceOver-Funktion einschalten, das integrierte Vorleseprogramm von Apple. 

ZEIT ONLINE hat es auch mit angepassten Sprach- und Region-Einstellungen auf zwei iPhones nicht geschafft, das Tool zu testen. Das dürfte sich aber bald ändern, denn Facebook hat weitere Sprachversionen und die Unterstützung anderer Plattformen bereits in Aussicht gestellt.

Facebooks neuronales Netzwerk wurde mit Millionen von Fotos trainiert. Nach Angaben des Unternehmens erkennt es nun rund 100 verschiedene Objekte und Szenerien, darunter solche, die etwas mit Transport zu tun haben, wie zum Beispiel Autos, Boote und Motorräder, oder Sportarten wie Tennis und Schwimmen, Essen wie Sushi, Pizza und Süßspeisen sowie Berge, Wellen, die Sonne, Gras, Lächeln, Selfies, Babys und einiges mehr.

Tiere soll es noch nicht erkennen ? eine Vorsichtsmaßnahme. Denn auch Facebook hat natürlich mitbekommen, welche Folgen es hat, wenn die Technik versagt, so wie es Google passiert ist. Dessen Bilderkennungssoftware hatte im vergangenen Sommer das Schlagwort Gorilla für mehrere Fotos vorgeschlagen, auf denen eine Afroamerikanerin zu sehen war. Und noch eine Vorsichtsmaßnahme: AAT listet stets nur auf, was sich auf einem Bild befinden könnte: „Image may contain ?„. Definitive Aussagen traut Facebook seinem Algorithmus noch nicht zu.

Auch andere Unternehmen arbeiten an solchen Hilfen für Sehgeschädigte. Microsoft etwa hat in der vergangenen Woche auf seiner Entwicklerkonferenz Build ein Projekt vorgestellt, bei dem Blinde Spezialbrillen oder Smartphones benutzen können, um ihre Umgebung besser wahrzunehmen. Die Technik soll beispielsweise umstehende Menschen beschreiben oder Speisekarten in Restaurants vorlesen können.

Empfohlene Lektüre

passend zum Thema