Sprachtechnologien öffnen das Tor zu einem vernetzteren, innovativeren und zugänglicheren Europa.
Sprachtechnologien (LT) ermöglichen es Maschinen nicht nur, menschliche Sprache zu lesen, zu analysieren, zu verarbeiten und zu erzeugen, sondern dank der jüngsten wissenschaftlichen Fortschritte auch, die Kluft zwischen menschlicher Kommunikation und Maschinenverständnis zu überbrücken.
Da Sprache als grundlegendes Medium für die menschliche Interaktion dient, hat LT eine immense Bedeutung in verschiedenen Branchen und Anwendungen gewonnen, von der Übersetzung und Lokalisierung über den Kundensupport bis hin zum Gesundheitswesen, der Medienerstellung und dem Marketing. Häufige Beispiele für diese Technologie sind Spracherkennung, intelligente Assistenten, maschinelle Übersetzung, Chatbots, Textzusammenfassung und automatische Untertitelung.
Was ist für die Entwicklung von Sprachtechnologien erforderlich?
Im Folgenden sind einige der Schlüsselelemente für die Entwicklung sprachbasierter Tools und Dienste aufgeführt.
- Sprachdaten: dies bezieht sich auf die textuellen oder gesprochenen Inhalte – in einer oder mehreren Sprachen –, die als Input- oder Schulungsmaterial für Aufgaben der Verarbeitung natürlicher Sprache dienen, z. B. Textgenerierung oder Sentimentanalyse. Diese Daten können aus einer Vielzahl von Quellen stammen – Bücher, Artikel, Social-Media-Beiträge, Transkripte gesprochener Gespräche usw. Da sie die Grundlage für die LT-Entwicklung bilden, ist es von entscheidender Bedeutung, dass sie unter uneingeschränkter Achtung des Urheberrechts (IPR) und der Bestimmungen zum Schutz personenbezogener Daten (DSGVO) erhoben werden.
- Schulungsalgorithmen und Sprachmodelle: Algorithmen sind die Software, die „Rezepte“, um Modelle menschlicher Sprachen zu erstellen. Mit erheblichen Mengen an Qualitätsdaten haben die neuesten Machine-Learning-Algorithmen eine erhöhte Fähigkeit gezeigt, Modelle zu erstellen, die das aus Sprachdaten abgeleitete Wissen repräsentieren. Je größer die Ressourcen und Modelle sind, desto umfassender und allgemeiner sind ihre Anwendungen.
- Rechenleistung: Insbesondere bei der Erstellung von Sprachmodellen, bei denen Hochleistungsrechnen und robuste Cloud-Infrastrukturen von entscheidender Bedeutung sind, sind erhebliche Rechenressourcen erforderlich.
- Humanexpertise: Erfolgreiche LT beinhalten die Zusammenarbeit zwischen Linguisten, Datenwissenschaftlern, Computeringenieuren und Domänenspezialisten.
Was unternimmt Europa, um Sprachtechnologien zu entwickeln?
In Europa haben wir eine komplexe Sprachlandschaft. Die Charta der Grundrechte der Europäischen Union verbietet Diskriminierungen aus Gründen der Sprache und verpflichtet die EU zur Achtung der sprachlichen Vielfalt. Rechenschaftspflicht, Transparenz, Fairness und die Achtung unserer Werte sind nur einige ihrer ethischen Implikationen. Diese Rechte und Grundsätze können nur durch eine unvoreingenommene Nutzung von LT gewährleistet werden.
Die europäische LT-Industrie spielt eine Schlüsselrolle für die strategische und technologische Autonomie Europas, die weiter gestärkt werden sollte. Unsere spezifischen Marktbedürfnisse sind am besten bei europäischen LT p roviders bekannt, von denen Hunderte im Katalog der eTranslation Services aufgeführt sind.
Öffentlich verfügbare Lösungen, einschließlich der von der Europäischen Kommission angebotenen Tools und Dienste, ergänzen das Marktangebot und beheben gleichzeitig einen Mangel an Technologieunterstützung für ressourcenschwache Sprachen. Diese grundlegenden Lösungen – maschinelle Übersetzung (eTranslation), Erkennung benannter Einrichtungen, Zusammenfassung, Sprachtranskription und Datenpseudonymisierung für die Einhaltung der DSGVO – stehen allen europäischen öffentlichen Verwaltungen und kleinen und mittleren Unternehmen in allen Amtssprachen zur Verfügung.
Im Rahmen von Horizont 2020 hat das Europäische Sprachennetz (ELG) eine zentrale Anlaufstelle für spezialisierte LT-Lösungen geschaffen. Die Bemühungen um die Verbreitung und den Aufbau von Gemeinschaften haben dazu beigetragen, ein gemeinsames Verständnis für die Notwendigkeit zu fördern, sich öffentlichen und privaten Kräften anzuschließen und das Beste aus beiden Welten in Forschung und Einsatz zu nutzen.
Im Rahmen des Programms „Horizont Europa“ werden Forschung und Innovation gefördert, indem die Entwicklung fortgeschrittener Langzeittechnologien, einschließlich großer Sprachmodelle, unterstützt wird, die über den Stand der Technik hinausgehen. Diese Modelle, die entwickelt wurden, um die Mensch-Maschine-Interaktion zu verbessern, verfügen über mehrsprachige Fähigkeiten, behandeln mehrere Eingabemodi, verwalten Verzerrungen und zeigen Kontextbewusstsein.
Im Rahmen der Initiative „Europäische Sprachengleichstellung“, einem vom Europäischen Parlament initiierten Pilotprojekt/vorbereitenden Maßnahme, wurden eine Agenda und ein Fahrplan für die vollständige Gleichstellung digitaler Sprachen in Europa bis 2030 entwickelt.
Im Rahmen des Politikprogramms für die digitale Dekade koordiniert die Kommission die Anstrengungen der Union in den Mitgliedstaaten und im Privatsektor zur Entwicklung eines europäischen LT-Ökosystems.
Schließlich erkennt die Kommission den Wert von Sprachdaten als Grundlage für die Ausbildung von Sprachmodellen im Rahmen des Gemeinsamen Europäischen Sprachdatenraums (LDS) an. Das im Rahmen des DIGITAL-Arbeitsprogramms 2021-2022 finanzierte Projekt zielt darauf ab, eine Plattform und einen Marktplatz für die Erhebung, gemeinsame Nutzung und Weiterverwendung mehrsprachiger und multimodaler Sprachdaten einzurichten. Im Einklang mit der Europäischen Datenstrategie und dem Konzept der Datenräume wird sie dafür sorgen, dass mehr Sprachdaten für die Nutzung in Wirtschaft, Gesellschaft und Forschung zur Verfügung stehen und gleichzeitig die Unternehmen und Einzelpersonen, die die Daten generieren, die Kontrolle behalten.
All diese Elemente, Projekte und Akteure zusammenzubringen, ist eine große Herausforderung für die Union, die europäische Industrie und die nationalen öffentlichen Verwaltungen – mit dem letztendlichen Ziel, die digitale Dekade Europas zum Nutzen aller zu unterstützen.
Die neuesten Nachrichten

Die Kommission begrüßt die Gründung des Konsortiums „Alliance for Language Technologies European Digital Infrastructure Consortium“ (ALT-EDIC) und des Sprachendatenraums (LDS).

The Commission has selected a consortium that will develop ‘Simpl' – a secure middleware platform that will support data access and interoperability among European data spaces, unleashing the power of data-driven innovation.

Die Kommission hat ein Konsortium ausgewählt, das „Simpl“ entwickeln wird – eine sichere Middleware-Plattform, die den Datenzugang und die Interoperabilität zwischen europäischen Datenräumen unterstützt und die Kraft datengesteuerter Innovationen freisetzt.

Die Kommission hat eine Empfehlung zu kritischen Technologiebereichen für die wirtschaftliche Sicherheit der EU und zur weiteren Risikobewertung mit den Mitgliedstaaten angenommen.
Zugehöriger Inhalt
Gesamtbild
Vertiefen
-

Die EU unterstützt Forschung, Innovation und den Einsatz von Sprachtechnologien, um Sprachbarrieren...
Sprachtechnologien und Mehrsprachigkeit

Die digitale Inklusion ist eine EU-weite Anstrengung, um sicherzustellen, dass jeder zur digitalen...

Daten sind überall und wachsen in einem beispiellosen Tempo. Um die Vorteile der Daten voll...