Skip to main content
Shaping Europe’s digital future

Sprogteknologier

Sprogteknologier åbner porten til et mere forbundet, innovativt og tilgængeligt Europa.

Sprogteknologier (LT) gør det muligt for maskiner ikke kun at læse, analysere, behandle og generere menneskeligt sprog, men også, takket være de seneste videnskabelige fremskridt, at bygge bro mellem menneskelig kommunikation og maskinforståelse.

Da sprog fungerer som det grundlæggende medium for menneskelig interaktion, har LT fået enorm betydning på tværs af forskellige brancher og applikationer, fra oversættelse og lokalisering til kundesupport, sundhedspleje, medieskabelse og markedsføring. Almindelige eksempler på denne teknologi er talegenkendelse, intelligente assistenter, maskinoversættelse, chatbots, tekstopsummering og automatisk undertekstning.

Hvad skal der til for at udvikle sprogteknologier?

Nedenfor er nogle af de vigtigste elementer i udviklingen af sprogbaserede værktøjer og tjenester.

  • Sprogoplysninger: dette refererer til det tekstmæssige eller talte indhold — på et eller flere sprog — der tjener som input eller undervisningsmateriale til opgaver i forbindelse med naturlig sprogbehandling, f.eks. tekstgenerering eller følelsesanalyse. Disse data kan komme fra en række kilder — bøger, artikler, indlæg på sociale medier, udskrifter af talte samtaler osv. Da det danner grundlaget for LT-udvikling, er det afgørende, at de indsamles under fuld overholdelse af bestemmelserne om ophavsret (IPR) og beskyttelse af personoplysninger (GDPR).
  • Træningsalgoritmer og sprogmodeller: algoritmer er den software, "opskrifter', til at skabe modeller af menneskelige sprog. Med betydelige mængder kvalitetsdata har de nyeste Machine Learning-algoritmer vist øgede evner til at skabe modeller, der repræsenterer den viden, der stammer fra sprogdata. Jo større ressourcer og modeller er, jo mere omfattende og generiske er deres applikationer.
  • Beregningseffekt: der er behov for betydelige beregningsressourcer, navnlig i forbindelse med oprettelsen af sprogmodeller, hvor højtydende databehandling og robust cloudinfrastruktur er afgørende.
  • Menneskelig ekspertise: vellykket LT involverer samarbejde mellem lingvister, dataforskere, computeringeniører og domænespecialister.

Hvad gør Europa for at udvikle sprogteknologier?

I Europa har vi et komplekst sproglandskab. Den Europæiske Unions charter om grundlæggende rettigheder forbyder forskelsbehandling på grund af sprog og pålægger EU en forpligtelse til at respektere den sproglige mangfoldighed. Ansvarlighed, gennemsigtighed, retfærdighed og respekt for vores værdier er kun nogle få af dens etiske konsekvenser. Disse rettigheder og principper kan kun garanteres ved en upartisk brug af LT.

Den europæiske LT -industri spiller en central rolle i Europas strategiske og teknologiske autonomi, som bør styrkes yderligere. Vores specifikke markedsbehov er bedst kendt af europæiske LT providers, hvoraf hundredvis er opført i kataloget over eTranslation Services.

Offentligt tilgængelige løsninger, herunder værktøjer og tjenester, der tilbydes af Europa-Kommissionen, supplerer markedstilbuddet og afhjælper samtidig manglen på teknologistøtte til sprog med lav ressource. Disse grundlæggende løsninger — maskinoversættelse (eTranslation), navngivet enhedsgenkendelse, summarisering, taletransskription og data pseudonymisering for overholdelse af GDPR — er tilgængelige for alle europæiske offentlige myndigheder og små og mellemstore virksomheder på alle officielle sprog.

Under Horisont 2020 oprettede det europæiske sprognet (ELG) en kvikskranke med specialiserede LT-løsninger. Indsatsen for formidling og opbygning af lokalsamfund har bidraget til at fremme en fælles forståelse af nødvendigheden af at slutte sig til offentlige og private kræfter og drage fordel af det bedste fra begge verdener inden for forskning og udbredelse.

Horisont Europa-programmet fremmer forskning og innovation gennem støtte til udvikling af avanceret avanceret LT, herunder store sprogmodeller. Disse modeller, der er designet til at forbedre interaktionen mellem mennesker og maskiner, vil have flersprogede evner, håndtere flere former for input, håndtere skævheder og udvise kontekstbevidsthed.

Initiativet European Language Equality (ELE), et pilotprojekt/forberedende foranstaltning iværksat af Europa-Parlamentet, udviklede en dagsorden og en køreplan for opnåelse af fuld ligestilling mellem digitale sprog i Europa inden 2030.

Under det politiske program for det digitale årti koordinerer Kommissionen en EU-indsats på tværs af medlemsstaterne og den private sektor for at udvikle et europæisk LT-økosystem.

Endelig anerkender Kommissionen værdien af sprogdata som grundlag for uddannelse af sprogmodeller gennem det fælles europæiske sprogdataområde ( LDS). Projektet, der finansieres under DIGITAL-arbejdsprogrammet for 2021-2022, har til formål at etablere en platform og en markedsplads for indsamling, deling og videreanvendelse af flersprogede og multimodale sprogdata. I overensstemmelse med den europæiske strategi for data og selve begrebet dataområder vil det sikre, at flere sprogdata bliver tilgængelige til brug i økonomi, samfund og forskning, samtidig med at de virksomheder og enkeltpersoner, der genererer dataene, holdes under kontrol.

At samle alle disse elementer, projekter og aktører er en stor udfordring for Unionen, den europæiske industri og de nationale offentlige forvaltninger — det endelige mål er at støtte Europas digitale årti til gavn for alle.

Seneste nyt

Se også

Det store billede

Europa er ved at omdanne sig til et AI-kontinent ved at fremme udviklingen og udbredelsen af nye AI-applikationer, samtidig med at det sikres, at kunstig intelligens forbliver sikker og respekterer EU's værdier.

Grav dybere

Sprogteknologier og flersprogethed

A line of different coloured wooden stick figure shapes, with the yellow one standing to the left

Digital inklusion er en EU-dækkende indsats for at sikre, at alle kan bidrage til og drage fordel af...

Visual representation of data

Data er overalt og vokser i et hidtil uset tempo. For fuldt ud at høste fordelene ved data har...