Skip to main content
Gestaltung der digitalen Zukunft Europas

Sprachtechnologien

Sprachtechnologien öffnen das Tor zu einem vernetzteren, innovativeren und zugänglicheren Europa.

Sprachtechnologien (LT) ermöglichen es Maschinen nicht nur, menschliche Sprache zu lesen, zu analysieren, zu verarbeiten und zu erzeugen, sondern dank der jüngsten wissenschaftlichen Fortschritte auch, die Kluft zwischen menschlicher Kommunikation und Maschinenverständnis zu überbrücken.

Da Sprache als grundlegendes Medium für die menschliche Interaktion dient, hat LT eine immense Bedeutung in verschiedenen Branchen und Anwendungen gewonnen, von der Übersetzung und Lokalisierung über den Kundensupport bis hin zum Gesundheitswesen, der Medienerstellung und dem Marketing. Häufige Beispiele für diese Technologie sind Spracherkennung, intelligente Assistenten, maschinelle Übersetzung, Chatbots, Textzusammenfassung und automatische Untertitelung.

Was ist für die Entwicklung von Sprachtechnologien erforderlich?

Im Folgenden sind einige der Schlüsselelemente für die Entwicklung sprachbasierter Tools und Dienste aufgeführt.

  • Sprachdaten: dies bezieht sich auf die textuellen oder gesprochenen Inhalte – in einer oder mehreren Sprachen –, die als Input- oder Schulungsmaterial für Aufgaben der Verarbeitung natürlicher Sprache dienen, z. B. Textgenerierung oder Sentimentanalyse. Diese Daten können aus einer Vielzahl von Quellen stammen – Bücher, Artikel, Social-Media-Beiträge, Transkripte gesprochener Gespräche usw. Da sie die Grundlage für die LT-Entwicklung bilden, ist es von entscheidender Bedeutung, dass sie unter uneingeschränkter Achtung des Urheberrechts (IPR) und der Bestimmungen zum Schutz personenbezogener Daten (DSGVO) erhoben werden.
  • Schulungsalgorithmen und Sprachmodelle: Algorithmen sind die Software, die „Rezepte“, um Modelle menschlicher Sprachen zu erstellen. Mit erheblichen Mengen an Qualitätsdaten haben die neuesten Machine-Learning-Algorithmen eine erhöhte Fähigkeit gezeigt, Modelle zu erstellen, die das aus Sprachdaten abgeleitete Wissen repräsentieren. Je größer die Ressourcen und Modelle sind, desto umfassender und allgemeiner sind ihre Anwendungen.
  • Rechenleistung: Insbesondere bei der Erstellung von Sprachmodellen, bei denen Hochleistungsrechnen und robuste Cloud-Infrastrukturen von entscheidender Bedeutung sind, sind erhebliche Rechenressourcen erforderlich.
  • Humanexpertise: Erfolgreiche LT beinhalten die Zusammenarbeit zwischen Linguisten, Datenwissenschaftlern, Computeringenieuren und Domänenspezialisten.

Was unternimmt Europa, um Sprachtechnologien zu entwickeln?

In Europa haben wir eine komplexe Sprachlandschaft. Die Charta der Grundrechte der Europäischen Union verbietet Diskriminierungen aus Gründen der Sprache und verpflichtet die EU zur Achtung der sprachlichen Vielfalt. Rechenschaftspflicht, Transparenz, Fairness und die Achtung unserer Werte sind nur einige ihrer ethischen Implikationen. Diese Rechte und Grundsätze können nur durch eine unvoreingenommene Nutzung von LT gewährleistet werden.

Die europäische LT-Industrie spielt eine Schlüsselrolle für die strategische und technologische Autonomie Europas, die weiter gestärkt werden sollte. Unsere spezifischen Marktbedürfnisse sind am besten bei europäischen LT p roviders bekannt, von denen Hunderte im Katalog der eTranslation Services aufgeführt sind.

Öffentlich verfügbare Lösungen, einschließlich der von der Europäischen Kommission angebotenen Tools und Dienste, ergänzen das Marktangebot und beheben gleichzeitig einen Mangel an Technologieunterstützung für ressourcenschwache Sprachen. Diese grundlegenden Lösungen – maschinelle Übersetzung (eTranslation), Erkennung benannter Einrichtungen, Zusammenfassung, Sprachtranskription und Datenpseudonymisierung für die Einhaltung der DSGVO – stehen allen europäischen öffentlichen Verwaltungen und kleinen und mittleren Unternehmen in allen Amtssprachen zur Verfügung.

Im Rahmen von Horizont 2020 hat das Europäische Sprachennetz (ELG) eine zentrale Anlaufstelle für spezialisierte LT-Lösungen geschaffen. Die Bemühungen um die Verbreitung und den Aufbau von Gemeinschaften haben dazu beigetragen, ein gemeinsames Verständnis für die Notwendigkeit zu fördern, sich öffentlichen und privaten Kräften anzuschließen und das Beste aus beiden Welten in Forschung und Einsatz zu nutzen.

Im Rahmen des Programms „Horizont Europa“ werden Forschung und Innovation gefördert, indem die Entwicklung fortgeschrittener Langzeittechnologien, einschließlich großer Sprachmodelle, unterstützt wird, die über den Stand der Technik hinausgehen. Diese Modelle, die entwickelt wurden, um die Mensch-Maschine-Interaktion zu verbessern, verfügen über mehrsprachige Fähigkeiten, behandeln mehrere Eingabemodi, verwalten Verzerrungen und zeigen Kontextbewusstsein.

Im Rahmen der Initiative „Europäische Sprachengleichstellung“, einem vom Europäischen Parlament initiierten Pilotprojekt/vorbereitenden Maßnahme, wurden eine Agenda und ein Fahrplan für die vollständige Gleichstellung digitaler Sprachen in Europa bis 2030 entwickelt.

Im Rahmen des Politikprogramms für die digitale Dekade koordiniert die Kommission die Anstrengungen der Union in den Mitgliedstaaten und im Privatsektor zur Entwicklung eines europäischen LT-Ökosystems.

Schließlich erkennt die Kommission den Wert von Sprachdaten als Grundlage für die Ausbildung von Sprachmodellen im Rahmen des Gemeinsamen Europäischen Sprachdatenraums (LDS) an. Das im Rahmen des DIGITAL-Arbeitsprogramms 2021-2022 finanzierte Projekt zielt darauf ab, eine Plattform und einen Marktplatz für die Erhebung, gemeinsame Nutzung und Weiterverwendung mehrsprachiger und multimodaler Sprachdaten einzurichten. Im Einklang mit der Europäischen Datenstrategie und dem Konzept der Datenräume wird sie dafür sorgen, dass mehr Sprachdaten für die Nutzung in Wirtschaft, Gesellschaft und Forschung zur Verfügung stehen und gleichzeitig die Unternehmen und Einzelpersonen, die die Daten generieren, die Kontrolle behalten.

All diese Elemente, Projekte und Akteure zusammenzubringen, ist eine große Herausforderung für die Union, die europäische Industrie und die nationalen öffentlichen Verwaltungen – mit dem letztendlichen Ziel, die digitale Dekade Europas zum Nutzen aller zu unterstützen.

Die neuesten Nachrichten

Zugehöriger Inhalt

Gesamtbild

Europa wandelt sich zum KI-Kontinent, indem es die Entwicklung und Einführung neuer KI-Anwendungen fördert und gleichzeitig sicherstellt, dass KI sicher bleibt und die Werte der EU respektiert.

Vertiefen

Sprachtechnologien und Mehrsprachigkeit

A line of different coloured wooden stick figure shapes, with the yellow one standing to the left

Die digitale Inklusion ist eine EU-weite Anstrengung, um sicherzustellen, dass jeder zur digitalen...

Visual representation of data

Daten sind überall und wachsen in einem beispiellosen Tempo. Um die Vorteile der Daten voll...