Skip to main content
Shaping Europe’s digital future

Sprogteknologier

Sprogteknologier åbner døren til et mere forbundet, innovativt og tilgængeligt Europa.

Sprogteknologier (LT) gør det muligt for maskiner ikke blot at læse, analysere, behandle og generere menneskeligt sprog, men også, takket være de seneste videnskabelige fremskridt, at bygge bro over kløften mellem menneskelig kommunikation og maskinforståelse.

Da sprog fungerer som det grundlæggende medie for menneskelig interaktion, har LT fået enorm betydning på tværs af forskellige brancher og applikationer, fra oversættelse og lokalisering til kundesupport, sundhedspleje, medieskabelse og markedsføring. Almindelige eksempler på denne teknologi er talegenkendelse, intelligente assistenter, maskinoversættelse, chatbots, tekstsammenfatning og automatisk undertekstning.

Hvad skal der til for at udvikle sprogteknologier?

Nedenfor er nogle af de vigtigste elementer i udviklingen af sprogbaserede værktøjer og tjenester.

  • Sprogoplysninger: Dette henviser til det tekstmæssige eller talte indhold – på et eller flere sprog – der tjener som input eller undervisningsmateriale til opgaver i forbindelse med behandling af naturligt sprog, f.eks. tekstgenerering eller følelsesanalyse. Disse data kan komme fra en række forskellige kilder – bøger, artikler, opslag på sociale medier, udskrifter af talte samtaler osv. Da de udgør grundlaget for LT-udviklingen, er det afgørende, at de indsamles under fuld overholdelse af bestemmelserne om ophavsret (IPR) og beskyttelse af personoplysninger (GDPR).
  • Træningsalgoritmer og sprogmodeller: algoritmer er softwaren, "opskrifterne", til at skabe modeller af menneskelige sprog. Med betydelige mængder kvalitetsdata har de nyeste maskinlæringsalgoritmer vist øgede evner til at skabe modeller, der repræsenterer den viden, der stammer fra sprogdata. Jo større ressourcer og modeller er, jo mere omfattende og generiske er deres anvendelser.
  • Beregningseffekt: Der er behov for betydelige computerressourcer, navnlig i forbindelse med oprettelsen af sprogmodeller, hvor højtydende databehandling og robuste cloudinfrastrukturer er afgørende.
  • Menneskelig ekspertise: vellykket LT indebærer samarbejde mellem lingvister, datavidenskabsfolk, computeringeniører og domænespecialister.

Hvad gør Europa for at udvikle sprogteknologier?

I Europa har vi et komplekst sproglandskab. Den Europæiske Unions charter om grundlæggende rettigheder forbyder forskelsbehandling på grund af sprog og forpligter EU til at respektere den sproglige mangfoldighed. Ansvarlighed, gennemsigtighed, retfærdighed og respekt for vores værdier er kun nogle få af de etiske konsekvenser. Disse rettigheder og principper kan kun garanteres ved en upartisk brug af LT.

Den europæiske LT-industri spiller en central rolle i Europas strategiske og teknologiske autonomi, som bør styrkes yderligere. Vores specifikke markedsbehov er bedst kendt af europæiske LT p roviders, hvoraf hundredvis er opført i kataloget over eTranslation-tjenester.

Offentligt tilgængelige løsninger, herunder værktøjer og tjenester, der tilbydes af Europa-Kommissionen, supplerer markedsudbuddet og afhjælper samtidig en mangel i den teknologiske støtte til lavressourcesprog. Disse grundlæggende løsninger – maskinoversættelse (eTranslation), navngivet enhedsgenkendelse, sammenfatning, taletransskription og datapseudonymisering med henblik på overholdelse af GDPR – er tilgængelige for alle europæiske offentlige forvaltninger og små og mellemstore virksomheder på alle officielle sprog.

Under Horisont 2020 oprettede European Language Grid (ELG) en kvikskranke for specialiserede sprogteknologiløsninger. Bestræbelserne på formidling og opbygning af lokalsamfund har bidraget til at fremme en fælles forståelse af nødvendigheden af at forene offentlige og private kræfter og drage fordel af det bedste fra begge verdener inden for forskning og udbredelse.

Horisont Europa-programmet fremmer forskning og innovation gennem støtte til udvikling af mere end avanceret avanceret sprogteknologi, herunder store sprogmodeller. Disse modeller, der er designet til at forbedre interaktionen mellem mennesker og maskiner, vil have flersprogede kapaciteter, håndtere flere inputmetoder, håndtere bias og udvise kontekstbevidsthed.

Initiativet om europæisk sproglig ligestilling (ELE), et pilotprojekt/en forberedende foranstaltning iværksat af Europa-Parlamentet, udviklede en dagsorden og en køreplan for at opnå fuld digital sproglig ligestilling i Europa senest i 2030.

Under politikprogrammet for det digitale årti koordinerer Kommissionen en EU-indsats på tværs af medlemsstaterne og den private sektor for at udvikle et europæisk økosystem for livslang læring.

Endelig anerkender Kommissionen værdien af sprogdata som grundlag for uddannelse af sprogmodeller gennem det fælles europæiske sprogdataområde (LDS). Projektet, der finansieres under DIGITAL-arbejdsprogrammet for 2021-2022, har til formål at etablere en platform og en markedsplads for indsamling, deling og videreanvendelse af flersprogede og multimodale sprogdata. I overensstemmelse med den europæiske strategi for data og selve begrebet dataområder vil det sikre, at flere sprogdata bliver tilgængelige til brug i økonomien, samfundet og forskningen, samtidig med at de virksomheder og enkeltpersoner, der genererer dataene, bevarer kontrollen.

Det er en stor udfordring for Unionen, den europæiske industri og de nationale offentlige forvaltninger at samle alle disse elementer, projekter og aktører – det endelige formål er at støtte Europas digitale årti til gavn for alle.

Seneste nyheder

Se også

Det store billede

Europa er ved at omdanne sig til et AI-kontinent ved at fremme udviklingen og udbredelsen af nye AI-applikationer, samtidig med at det sikres, at kunstig intelligens forbliver sikker og respekterer EU's værdier.

Grav dybere

Sprogteknologier og flersprogethed

A line of different coloured wooden stick figure shapes, with the yellow one standing to the left

Digital inklusion er en EU-dækkende indsats for at sikre, at alle kan bidrage til og drage fordel af...

Visual representation of data

Data er overalt og vokser i et hidtil uset tempo. For fuldt ud at høste fordelene ved data har...