Skip to main content
Shaping Europe’s digital future

Taaltechnologieën

Taaltechnologieën openen de toegangspoort tot een meer verbonden, innovatiever en toegankelijker Europa.

    Visuele weergave van taal en technologieën: keuze uit stopcontacten om een kabel aan te sluiten, elk vertegenwoordigd door een vlag

©Getty Images/iStock

Taaltechnologieën (LT) stellen machines niet alleen in staat om menselijke taal te lezen, te analyseren, te verwerken en te genereren, maar ook, dankzij recente wetenschappelijke vooruitgang, om de kloof tussen menselijke communicatie en machinebegrip te overbruggen.

Omdat taal dient als het fundamentele medium voor menselijke interactie, heeft LT enorm belang gewonnen in verschillende industrieën en toepassingen, van vertaling en lokalisatie tot klantondersteuning, gezondheidszorg, mediacreatie en marketing. Veel voorkomende voorbeelden van deze technologie zijn spraakherkenning, slimme assistenten, machinevertaling, chatbots, tekstsamenvatting en automatische ondertiteling.

Wat is er nodig om taaltechnologieën te ontwikkelen?

Hieronder vindt u enkele van de belangrijkste elementen voor de ontwikkeling van op taal gebaseerde instrumenten en diensten.

  • Taalgegevens: dit verwijst naar de tekstuele of gesproken inhoud — in een of meer talen — die dient als input- of trainingsmateriaal voor taken op het gebied van Natural Language Processing, zoals tekstgeneratie of sentimentanalyse. Deze gegevens kunnen afkomstig zijn uit verschillende bronnen — boeken, artikelen, berichten op sociale media, transcripties van gesproken gesprekken, etc. Omdat het de basis vormt voor de ontwikkeling van LT, is het van vitaal belang dat ze worden verzameld met volledige inachtneming van de bepalingen inzake auteursrecht (IPR) en bescherming van persoonsgegevens (AVG).
  • Opleidingsalgoritmen en taalmodellen: algoritmen zijn de software, de „recepten”, om modellen van menselijke talen te creëren. Met aanzienlijke hoeveelheden kwaliteitsgegevens hebben de nieuwste Machine Learning-algoritmen meer mogelijkheden getoond om modellen te maken die de kennis vertegenwoordigen die is afgeleid van taalgegevens. Hoe groter de middelen en modellen zijn, hoe omvattender en generieker hun toepassingen zijn.
  • Rekenkracht: er zijn aanzienlijke computationele middelen nodig, vooral tijdens het maken van taalmodellen, waar high-performance computing en robuuste cloud-infrastructuren cruciaal zijn.
  • Menselijke deskundigheid: succesvolle LT omvat samenwerking tussen taalkundigen, datawetenschappers, computeringenieurs en domeinspecialisten.

Wat doet Europa om taaltechnologieën te ontwikkelen?

In Europa hebben we een complex taallandschap. Het Handvest van de grondrechten van de Europese Unie verbiedt discriminatie op grond van taal en verplicht de EU om de taalverscheidenheid te eerbiedigen. Verantwoording, transparantie, eerlijkheid en respect voor onze waarden zijn slechts enkele van de ethische implicaties ervan. Deze rechten en principes kunnen alleen worden gewaarborgd door een onbevooroordeeld gebruik van LT.

De Europese LT -industrie speelt een sleutelrol in de strategische en technologische autonomie van Europa, die verder moet worden versterkt. Onze specifieke marktbehoeften zijn het best bekend bij Europese LT providers, waarvan er honderden zijn opgenomen in de Catalogus van eTranslation Services.

Openbaar beschikbare oplossingen, waaronder instrumenten en dienstendie door de Europese Commissieworden aangeboden, vullen het marktaanbod aan en verhelpen tegelijkertijd een tekort aan technologische ondersteuning voor talen met weinig middelen. Deze basisoplossingen — machinevertaling (eTranslation), genoemde entiteitsherkenning, samenvattingen, spraaktranscriptie en datapseudonimisering voor de naleving van de AVG — zijn beschikbaar voor alle Europese overheidsdiensten en kleine en middelgrote ondernemingen in alle officiële talen.

In het kader van Horizon 2020 heeft het European Language Grid (ELG) een one-stop-shop van gespecialiseerde LT-oplossingen gecreëerd. Inspanningen op het gebied van verspreiding en gemeenschapsopbouw hebben bijgedragen tot het bevorderen van een gemeenschappelijk begrip over de noodzaak om publieke en private krachten te bundelen en te profiteren van het beste van beide werelden op het gebied van onderzoek en inzet.

Het Horizon Europa-programma bevordert onderzoek en innovatie door ondersteuning van de ontwikkeling van geavanceerde geavanceerde LT, met inbegrip van grote taalmodellen. Deze modellen, ontworpen om de interactie tussen mens en machine te verbeteren, zullen meertalige mogelijkheden hebben, meerdere ingangsmodi verwerken, vooroordelen beheren en contextbewustzijn vertonen.

Het initiatief „Europese taalgelijkheid” (ELE), een proefproject/voorbereidende actie van het Europees Parlement, heeft een agenda en een routekaart ontwikkeld voor het bereiken van volledige gelijkheid van digitale talen in Europa tegen 2030.

In het kader van het programma voor het digitale decennium coördineert de Commissie een inspanning van de Unie in de lidstaten en de particuliere sector om een Europees langetermijnecosysteem te ontwikkelen.

Tot slot erkent de Commissie de waarde van taalgegevens als basis voor de opleiding van taalmodellen via de gemeenschappelijke Europese ruimte voor taalgegevens (LDS). Het project wordt gefinancierd in het kader van het DIGITAL-werkprogramma 2021-2022 en heeft tot doel een platform en een marktplaats in te zetten voor het verzamelen, delen en hergebruik van meertalige en multimodale taalgegevens. In overeenstemming met de Europese datastrategie en het concept van dataruimten zal het ervoor zorgen dat er meer taalgegevens beschikbaar komen voor gebruik in de economie, de samenleving en het onderzoek, terwijl de bedrijven en personen die de gegevens genereren onder controle worden gehouden.

Het samenbrengen van al deze elementen, projecten en actoren is een grote uitdaging voor de Unie, de Europese industrie en de nationale overheidsdiensten.

Laatste nieuws

Gerelateerde inhoud

Grote afbeelding

Kunstmatige intelligentie

De EU streeft ernaar betrouwbare kunstmatige intelligentie (AI) op te bouwen die mensen op de eerste plaats zet.

Zoek verder

Taaltechnologieën en meertaligheid

De EU steunt onderzoek, innovatie en de toepassing van taaltechnologieën om taalbarrières weg te nemen en tegelijkertijd meertaligheid te behouden en te bevorderen.

Zie ook

AI-fabrieken

AI-fabrieken maken gebruik van de supercomputercapaciteit van de Gemeenschappelijke Onderneming EuroHPC om betrouwbare geavanceerde generatieve AI-modellen te ontwikkelen.

Europees AI-bureau

Het Europees AI-bureau zal het centrum van KI-expertise in de hele EU zijn. Het zal een sleutelrol spelen bij de uitvoering van de AI-wet — met name voor AI voor algemene doeleinden — de ontwikkeling en het gebruik van betrouwbare AI en internationale samenwerking bevorderen.

Robotica

De EU bevordert actief onderzoek, het scheppen van banen en innovatie door middel van betere en veiligere robots, met behoud van ethische aspecten van de geboekte vooruitgang.

Europese benadering van artificiële intelligentie

De EU-aanpak van artificiële intelligentie is gericht op excellentie en vertrouwen, met als doel de onderzoeks- en industriële capaciteit te vergroten en tegelijkertijd de veiligheid en de grondrechten te waarborgen.

Taaltechnologieën en meertaligheid

Digitale inclusie

Digitale inclusie is een EU-brede inspanning opdat iedereen kan bijdragen aan en profijt kan trekken...

Data

Data is overal en groeit in een ongekend tempo. De Commissie heeft een Europese datastrategie...