
AdobeStock © oum
Om het tekort aan Europese taalgegevens aan te pakken dat nodig is voor de opleiding van grote taalmodellen, zullen deze projecten een revolutie teweegbrengen in meertalige artificiële-intelligentiesystemen (AI) in de hele EU.
Door diensten in alle EU-talen aan te bieden, zijn de initiatieven bedoeld om taalbarrières weg te nemen en betere, toegankelijkere oplossingen te bieden voor kleinere bedrijven binnen de EU. Deze inspanning is niet alleen gericht op het behoud van het rijke culturele en taalkundige erfgoed van de EU in het digitale tijdperk, maar versterkt ook de zoektocht van Europa naar technologische soevereiniteit. Het in februari 2024 opgerichte ALT-EDIC omvat 17 deelnemende lidstaten en 9 waarnemende lidstaten en regio’s, waardoor het een van de baanbrekende Consortia voor Europese digitale infrastructuur is.
De LDS, die deel uitmaakt van de gemeenschappelijke Europese dataruimten, is van cruciaal belang om de beschikbaarheid van gegevens voor de ontwikkeling van AI in Europa te vergroten. Dit project, dat door de Commissie is ontwikkeld en door het DIGITAL-programma wordt gefinancierd, heeft tot doel een samenhangende markt voor taalgegevens tot stand te brengen. Dit zal leiden tot een betere verzameling en uitwisseling van meertalige gegevens ter ondersteuning van Europese grote taalmodellen. Aanvankelijk toegankelijk voor geselecteerde instellingen en bedrijven, beoogt het project uiteindelijk alle Europese publieke en private belanghebbenden te betrekken.
Meer informatie over het Alliance for Language Technologies European Digital Infrastructure Consortium (ALT-EDIC) en de Language Data Space (LDS).