Le tecnologie linguistiche stanno aprendo la porta a un'Europa più connessa, innovativa e accessibile.
Le tecnologie del linguaggio (LT) consentono alle macchine non solo di leggere, analizzare, elaborare e generare il linguaggio umano, ma anche, grazie ai recenti progressi scientifici, di colmare il divario tra la comunicazione umana e la comprensione delle macchine.
Dal momento che la lingua funge da mezzo fondamentale per l'interazione umana, LT ha acquisito un'enorme importanza in vari settori e applicazioni, dalla traduzione e localizzazione all'assistenza clienti, all'assistenza sanitaria, alla creazione di media e al marketing. Esempi comuni di questa tecnologia sono il riconoscimento vocale, gli assistenti intelligenti, la traduzione automatica, i chatbot, la sintesi testuale e la sottotitolazione automatica.
Che cosa è necessario per sviluppare le tecnologie del linguaggio?
Di seguito sono riportati alcuni degli elementi chiave per sviluppare strumenti e servizi basati sulle lingue.
- Dati linguistici: si riferisce al contenuto testuale o parlato – in una o più lingue – che funge da materiale di input o di formazione per le attività di elaborazione del linguaggio naturale, ad esempio la generazione di testo o l'analisi del sentimento. Questi dati possono provenire da una varietà di fonti: libri, articoli, post sui social media, trascrizioni di conversazioni parlate, ecc. Poiché costituiscono il fondamento dello sviluppo delle LT, è fondamentale che siano raccolti nel pieno rispetto delle disposizioni in materia di diritto d'autore (DPI) e protezione dei dati personali (RGPD).
- Algoritmi di formazione e modelli linguistici: gli algoritmi sono il software, le "ricette", per creare modelli di linguaggi umani. Con notevoli quantità di dati di qualità, gli ultimi algoritmi di Machine Learning hanno mostrato maggiori capacità di creare modelli che rappresentano le conoscenze derivate dai dati linguistici. Quanto più grandi sono le risorse e i modelli, tanto più ampie e generiche sono le loro applicazioni.
- Potenza di calcolo: sono necessarie risorse computazionali significative, in particolare durante la creazione di modelli linguistici, in cui il calcolo ad alte prestazioni e solide infrastrutture cloud sono fondamentali.
- Competenze umane: Il successo di LT implica la collaborazione tra linguisti, data scientist, ingegneri informatici e specialisti del settore.
Cosa fa l'Europa per sviluppare le tecnologie del linguaggio?
In Europa abbiamo un panorama linguistico complesso. La Carta dei diritti fondamentali dell'Unione europea vieta la discriminazione fondata sulla lingua e impone all'UE l'obbligo di rispettare la diversità linguistica. Responsabilità, trasparenza, equità e rispetto dei nostri valori sono solo alcune delle sue implicazioni etiche. Questi diritti e principi possono essere garantiti solo da un uso imparziale di LT.
L'industria europea delle tecnologie di telecomunicazione svolge un ruolo chiave nell'autonomia strategica e tecnologica dell'Europa, che dovrebbe essere ulteriormente rafforzata. Le nostre specifiche esigenze di mercato sono meglio conosciute dai rovider europei LT p, di cui centinaia sono elencati nel Catalogo dei servizi di eTranslation.
Le soluzioni disponibili al pubblico, compresi gli strumenti e i servizi offerti dalla Commissione europea, integrano l'offerta di mercato affrontando nel contempo una carenza nel sostegno tecnologico alle lingue a basse risorse. Queste soluzioni di base – la traduzione automatica (eTranslation), il riconoscimento di entità denominate, la sintesi, la trascrizione vocale e la pseudonimizzazione dei dati ai fini della conformità al regolamento generale sulla protezione dei dati – sono disponibili per tutte le pubbliche amministrazioni europee e le piccole e medie imprese in tutte le lingue ufficiali.
Nell'ambito di Orizzonte 2020, la rete linguistica europea (ELG) ha creato uno sportello unico di soluzioni specializzate per le lingue straniere. Gli sforzi di diffusione e di creazione di comunità hanno contribuito a promuovere un'intesa comune sulla necessità di unire le forze pubbliche e private e di beneficiare del meglio di entrambi i mondi nella ricerca e nella diffusione.
Il programma Orizzonte Europa promuove la ricerca e l'innovazione attraverso il sostegno allo sviluppo di tecnologie del linguaggio avanzate al di là dello stato dell'arte, compresi i modelli linguistici di grandi dimensioni. Questi modelli, progettati per migliorare l'interazione uomo-macchina, avranno capacità multilingue, gestiranno più modalità di input, gestiranno i pregiudizi e mostreranno consapevolezza del contesto.
Infine, la Commissione riconosce il valore dei dati linguistici come fondamento per la formazione di modelli linguistici attraverso lo spazio comune europeo dei dati linguistici (LDS). Finanziato nell'ambito del programma di lavoro digitale 2021-2022, il progetto mira a realizzare una piattaforma e un mercato per la raccolta, la condivisione e il riutilizzo di dati linguistici multilingue e multimodali. In linea con la strategia europea per i dati e con il concetto stesso di spazi di dati, garantirà la disponibilità di un maggior numero di dati linguistici da utilizzare nell'economia, nella società e nella ricerca, mantenendo nel contempo il controllo sulle imprese e sugli individui che generano i dati.
Riunire tutti questi elementi, progetti e attori è una sfida importante per l'Unione, l'industria europea e le pubbliche amministrazioni nazionali, con l'obiettivo ultimo di sostenere il decennio digitale europeo a beneficio di tutti.
Ultime notizie

La Commissione accoglie con favore il lancio del consorzio per un'infrastruttura digitale europea dell'Alleanza per le tecnologie linguistiche (ALT-EDIC) e dello spazio di dati linguistici (LDS).

The Commission has selected a consortium that will develop ‘Simpl' – a secure middleware platform that will support data access and interoperability among European data spaces, unleashing the power of data-driven innovation.

La Commissione ha selezionato un consorzio che svilupperà "Simpl", una piattaforma middleware sicura che sosterrà l'accesso ai dati e l'interoperabilità tra gli spazi di dati europei, liberando il potere dell'innovazione basata sui dati.

La Commissione ha adottato una raccomandazione sui settori tecnologici critici per la sicurezza economica dell'UE, ai fini di un'ulteriore valutazione del rischio con gli Stati membri.
Contenuti correlati
Quadro generale
Per ulteriori approfondimenti
-

L'UE sostiene la ricerca, l'innovazione e la diffusione delle tecnologie linguistiche per abbattere...
Tecnologie linguistiche e multilinguismo

L'inclusione digitale è uno sforzo a livello dell'UE per garantire che tutti possano contribuire al...

I dati sono ovunque e crescono a un ritmo senza precedenti. Per sfruttare appieno i vantaggi dei...