Skip to main content
Gestaltung der digitalen Zukunft Europas

Sprachtechnologien

Sprachtechnologien öffnen das Tor zu einem vernetzteren, innovativeren und zugänglicheren Europa.

    Visuelle Darstellung von Sprache und Technologien: eine Auswahl an Buchsen zum Einstecken eines Kabels, die jeweils durch eine Flagge dargestellt werden

©Getty Images/iStock

Sprachtechnologien (LT) ermöglichen Maschinen nicht nur, menschliche Sprache zu lesen, zu analysieren, zu verarbeiten und zu erzeugen, sondern auch dank neuer wissenschaftlicher Fortschritte die Kluft zwischen menschlicher Kommunikation und maschinellem Verständnis zu überbrücken.

Da Sprache als grundlegendes Medium für die menschliche Interaktion dient, hat LT in verschiedenen Branchen und Anwendungen immense Bedeutung gewonnen, von der Übersetzung und Lokalisierung bis hin zu Kundenbetreuung, Gesundheitswesen, Medienerstellung und Marketing. Häufige Beispiele für diese Technologie sind Spracherkennung, intelligente Assistenten, maschinelle Übersetzung, Chatbots, Textzusammenfassung und automatische Untertitelung.

Was ist nötig, um Sprachtechnologien zu entwickeln?

Im Folgenden sind einige der Schlüsselelemente für die Entwicklung sprachbasierter Werkzeuge und Dienstleistungen aufgeführt.

  • Sprachdaten: dies bezieht sich auf die textlichen oder gesprochenen Inhalte – in einer oder mehreren Sprachen – die als Eingabe- oder Schulungsmaterial für die Verarbeitung natürlicher Sprache dienen, z. B. Textgenerierung oder Sentimentanalyse. Diese Daten können aus einer Vielzahl von Quellen stammen – Bücher, Artikel, Social-Media-Posts, Transkripte von gesprochenen Gesprächen, etc. Da sie die Grundlage der LT-Entwicklung bilden, ist es wichtig, dass sie unter uneingeschränkter Achtung der Bestimmungen des Urheberrechts (IPR) und des Schutzes personenbezogener Daten (DSGVO) erhoben werden.
  • Schulungsalgorithmen und Sprachmodelle: Algorithmen sind die Software, die „Rezepte“, um Modelle menschlicher Sprachen zu erstellen. Mit erheblichen Mengen an Qualitätsdaten haben die neuesten Algorithmen des maschinellen Lernens eine erhöhte Fähigkeit gezeigt, Modelle zu erstellen, die das aus Sprachdaten abgeleitete Wissen darstellen. Je größer die Ressourcen und Modelle sind, desto umfassender und allgemeiner sind ihre Anwendungen.
  • Rechenleistung: es werden umfangreiche Rechenressourcen benötigt, insbesondere bei der Erstellung von Sprachmodellen, bei denen Hochleistungsrechnen und robuste Cloud-Infrastrukturen von entscheidender Bedeutung sind.
  • Menschliches Fachwissen: erfolgreiche LT umfasst die Zusammenarbeit zwischen Linguisten, Datenwissenschaftlern, Informatikern und Domänenspezialisten.

Was tut Europa, um Sprachtechnologien zu entwickeln?

In Europa gibt es eine komplexe Sprachlandschaft. Die Charta der Grundrechte der Europäischen Union verbietet Diskriminierungen aus Gründen der Sprache und verpflichtet die EU, die sprachliche Vielfalt zu achten. Rechenschaftspflicht, Transparenz, Fairness und Achtung unserer Werte sind nur einige ihrer ethischen Implikationen. Diese Rechte und Grundsätze können nur durch eine unvoreingenommene Nutzung von LT gewährleistet werden.

Die europäische LT -Industrie spielt eine Schlüsselrolle in der strategischen und technologischen Autonomie Europas, die weiter gestärkt werden sollte. Unsere spezifischen Marktbedürfnisse sind am besten von europäischen LT p Rovidernbekannt, von denen Hunderte im Katalog der eTranslation Services aufgeführt sind.

Öffentlich verfügbare Lösungen, einschließlich der von der Europäischen Kommissionangebotenen Instrumente und Dienste , ergänzen das Marktangebot und beseitigen gleichzeitig einen Mangel an Technologieunterstützungfür ressourcenarme Sprachen. Diese grundlegenden Lösungen – maschinelle Übersetzung (eTranslation), benannte Entitätserkennung, Zusammenfassung, Sprachtranskription und Daten-Pymonymisierung für die DSGVO-Compliance – stehen allen europäischen öffentlichen Verwaltungen und kleinen und mittleren Unternehmen in allen Amtssprachen zur Verfügung.

Im Rahmen von Horizont 2020 hat das European Language Grid (ELG) eine zentrale Anlaufstelle für spezialisierte LT-Lösungen geschaffen. Die Bemühungen um die Verbreitung und den Aufbau von Gemeinschaften haben dazu beigetragen, ein gemeinsames Verständnis über die Notwendigkeit zu fördern, öffentliche und private Kräfte zu verbinden und von den Besten beider Welten in Forschung und Einsatz zu profitieren.

Das Programm „Horizont Europa“ fördert Forschung und Innovation durch Unterstützung der Entwicklung von über den neuesten Stand der Technik hinausgehenden fortgeschrittenen LT, einschließlich großer Sprachmodelle. Diese Modelle, die zur Verbesserung der Mensch-Maschine-Interaktion entwickelt wurden, verfügen über mehrsprachige Fähigkeiten, behandeln mehrere Eingabemodi, verwalten Verzerrungen und zeigen Kontextbewusstsein.

Die Initiative „Europäische Sprachengleichstellung“ (ELE), ein vom Europäischen Parlament initiiertes Pilotprojekt/Vorbereitungsmaßnahme, hat eine Agenda und einen Fahrplan für die vollständige Gleichstellung digitaler Sprachen in Europa bis 2030 entwickelt.

Im Rahmen des Politikprogramms für die digitale Dekade koordiniert die Kommission die Bemühungen der Union in den Mitgliedstaaten und im Privatsektor, ein europäisches LT-Ökosystem zu entwickeln.

Schließlich erkennt die Kommission den Wert von Sprachdaten als Grundlage für die Ausbildung von Sprachmodellen durch den Gemeinsamen europäischen Sprachdatenraum ( LDS) an. Das im Rahmen des DIGITAL-Arbeitsprogramms 2021-2022 finanzierte Projekt zielt darauf ab, eine Plattform und einen Marktplatz für die Erhebung, den Austausch und die Weiterverwendung von mehrsprachigen und multimodalen Sprachdaten bereitzustellen. Im Einklang mit der Europäischen Datenstrategie und dem Konzept der Datenräume wird sichergestellt, dass mehr Sprachdaten für Wirtschaft, Gesellschaft und Forschung zur Verfügung stehen, während die Unternehmen und Einzelpersonen, die die Daten generieren, die Kontrolle behalten.

Die Zusammenführung all dieser Elemente, Projekte und Akteure stellt eine große Herausforderung für die Union, die europäische Industrie und die nationalen öffentlichen Verwaltungen dar – das letztendliche Ziel ist es, die digitale Dekade Europas zum Wohle aller zu unterstützen.

Neueste Nachrichten

Zugehöriger Inhalt

Gesamtbild

Künstliche Intelligenz

Die EU will vertrauenswürdige künstliche Intelligenz (KI) aufbauen, die Menschen an erster Stelle stellt.

Vertiefen

Sprachtechnologien & Mehrsprachigkeit

Die EU unterstützt Forschung, Innovation und den Einsatz von Sprachtechnologien, um Sprachbarrieren abzubauen und gleichzeitig die Mehrsprachigkeit zu erhalten und zu fördern.

Siehe auch

KI-Faktoren

KI-Fabriken nutzen die Supercomputing-Kapazitäten des Gemeinsamen Unternehmens EuroHPC, um vertrauenswürdige, hochmoderne generative KI-Modelle zu entwickeln.

Europäisches AI-Büro

Das Europäische KI-Büro wird das Zentrum für KI-Expertise in der gesamten EU sein. Sie wird bei der Umsetzung des KI-Gesetzes – insbesondere für die allgemeine KI – eine Schlüsselrolle spielen, um die Entwicklung und Nutzung vertrauenswürdiger KI sowie die internationale...

Robotik

Die EU fördert aktiv Forschung, Schaffung von Arbeitsplätzen und Innovation durch bessere und sicherere Roboter unter Wahrung ethischer Aspekte der erzielten Fortschritte.

Europäischer Ansatz für künstliche Intelligenz

Der Ansatz der EU für künstliche Intelligenz konzentriert sich auf Exzellenz und Vertrauen, um Forschung und industrielle Kapazitäten zu stärken und gleichzeitig Sicherheit und Grundrechte zu gewährleisten.

Sprachtechnologien und Mehrsprachigkeit

Digitale Inklusion

Digitale Inklusion bedeutet, dass alle Menschen an der digitalen Welt teilhaben und daraus einen...

Daten

Daten sind überall und wachsen in einem beispiellosen Tempo. Die Kommission hat eine europäische...