Europäische Sprachen vom digitalen Aussterben bedroht

Die Mehrheit der europäischen Sprachen wird in der digitalen Welt wohl nicht überleben. Zu diesem Ergebnis kommt eine großangelegte Studie, deren Ergebnisse [am 20. Sept. 2012] veröffentlicht wurden. Untersucht die technische Unterstützung für 30 europäische Sprachen. Dabei ging es um den Stand und die Entwicklung der Software, die Sprache verarbeitet oder generiert. Für 21 dieser Sprachen haben die Forscher diesbezüglich gar keinen oder höchstens einen schwachen digitalen Rückhalt festgestellt.

Angesichts der wachsenden Bedeutung von Sprachtechnik kann diese Situation für die betroffenen Sprachen im digitalen Raum tödlich sein, warnt die für die Studie verantwortliche Organisation META (Multilingual Europe Technology Alliance). Bereits heute greife unbewusst auf Sprachtechniken zurück, wer im Internet etwas sucht, einen Text schreibt, ein Gerät mit Sprachbefehlen steuert oder den Anweisungen eines Navigationssystems vertraut. Bald würden sich die Nutzer aber auch direkt mit Geräten unterhalten können. Auf diesen Wandel sei jedoch außer dem Englischen fast keine Sprache in Europa ausreichend vorbereitet.

Dokumentiert wurde die sprachtechnische Unterstützung für alle Amtssprachen der Europäischen Union, für wichtige Minderheitssprachen sowie Sprachen aus Nicht-EU-Ländern. Für jede einzelne liegen die ausführlichen Ergebnisse in einem Weißbuch vor, das kostenlos als PDF-Datei verfügbar ist. Darin wird die technische Unterstützung in den vier Anwendungsgebieten automatische Übersetzung, Erkennung und Generierung gesprochener Sprache, Textanalyse und Sprachressourcen dokumentiert.

Exzellente Unterstützung wurde dabei für keine der Sprachen festgestellt, gut unterstützt wird jeweils nur das Englische. Dahinter finden sich lediglich Französisch und Spanisch immer unter den Sprachen mit mittlerer Unterstützung. Deutsch dagegen schneidet jeweils gut ab, außer bei der maschinellen Übersetzung, die nur teilweise unterstützt wird. Damit landet Deutsch gleichauf mit Italienisch und Niederländisch. Besonders schlecht sind die Ergebnisse für Isländisch, Lettisch, Litauisch und Maltesisch. Diese Sprachen werden gegenwärtig kaum oder gar nicht technisch unterstützt.

Die immens große Lücke zwischen den Sprachen sei ein großes Problem auf dem Weg, die Sprachbarrieren als letzte große Grenzen in Europa zu überwinden. Deshalb sei eine gemeinschaftliche Anstrengung nötig, denn vor allem die kleinen Sprachen drohten, im digitalen Raum auszusterben. Gerade für sie sei es gleichzeitig wegen der oft mangelnden Ressourcen besonders schwierig, Sprachtechniken zu entwickeln.

Für die deutsche Sprache gibt sich das zugehörige Weißbuch (PDF-Datei) optimistisch. Allen Unkenrufen zum Trotz werde sie derzeit auch im digitalen Raum nicht vom Englischen verdrängt. Während nicht nur alle wichtigen Softwareprodukte in deutscher Sprache vorliegen, sehen die Forscher das Deutsche auch sprachtechnisch gut versorgt. Lediglich korrekte Übersetzungen in die deutsche Sprache würden nur selten gelingen, was aber auch an Eigenschaften der Sprache liege.

Für die Zukunft kritisch sei jedoch, dass Deutschland seine führende Rolle bei Sprachtechniken zu verlieren drohe. Als Grund dafür benennen sie stark gekürzte Fördermittel, die viele Experten dazu bewegt habe, in die USA abzuwandern. Zwar gebe es weiterhin Forschungsprojekte wie Theseus, aber hier werde sich immer stärker auf die englische Sprache konzentriert. Diese eigne sich nach Meinung einiger Wissenschaftler insgesamt besser zur digitalen Verarbeitung.

Auf solche strukturellen Unterschiede, die ihren Teil zu den Schwierigkeiten bei der Entwicklung von Sprachtechniken beitragen, geht die Studie immer wieder ein. Zur Illustration werden dabei Beispiele für besondere Herausforderungen erläutert. So ist der deutsche Satz „Der Pfarrer wollte den Apotheker heute treffen“ in mindestens 14 weiteren Wortreihenfolgen korrekt. Für die englische Übersetzung gibt es deren nur drei. Auch die Möglichkeit, im Deutschen prinzipiell unendlich lange Wörter zu bilden, stellt eine hohe Hürde für maschinelle Verarbeitung dar. (mho)

Heise vom 21.Sept.2012 http://www.heise.de/newsticker/…

Das könnte Dich auch interessieren...