Tehnologiile lingvistice deschid calea către o Europă mai conectată, mai inovatoare și mai accesibilă.
Tehnologiile limbajului (LT) permit mașinilor nu numai să citească, să analizeze, să proceseze și să genereze limbaj uman, ci și, datorită progreselor științifice recente, să reducă decalajul dintre comunicarea umană și înțelegerea mașinilor.
Deoarece limbajul servește ca mediu fundamental pentru interacțiunea umană, LT au câștigat o importanță imensă în diferite industrii și aplicații, de la traducere și localizare la asistență pentru clienți, asistență medicală, crearea de mass-media și marketing. Exemple comune ale acestei tehnologii sunt recunoașterea vorbirii, asistenții inteligenți, traducerea automată, roboții de chat, rezumarea textului și subtitrarea automată.
Ce este necesar pentru dezvoltarea tehnologiilor lingvistice?
Mai jos sunt prezentate câteva dintre elementele-cheie pentru dezvoltarea de instrumente și servicii lingvistice.
- Date privind limba: aceasta se referă la conținutul textual sau vorbit – în una sau mai multe limbi – care servește drept material de intrare sau de formare pentru sarcinile de prelucrare a limbajului natural, de exemplu generarea de text sau analiza sentimentelor. Aceste date pot proveni dintr-o varietate de surse – cărți, articole, postări pe platformele de comunicare socială, transcrieri ale conversațiilor vorbite etc. Întrucât constituie fundamentul dezvoltării tehnologiei informației pe tot parcursul vieții, este esențial ca acestea să fie colectate cu respectarea deplină a dispozițiilor privind drepturile de autor (DPI) și protecția datelor cu caracter personal (RGPD).
- Algoritmi de formare și modele lingvistice: algoritmii sunt software-ul, „rețetele”, pentru a crea modele de limbaje umane. Cu cantități substanțiale de date de calitate, cei mai recenți algoritmi de învățare automată au demonstrat abilități sporite de a crea modele reprezentând cunoștințele derivate din datele lingvistice. Cu cât sunt mai mari resursele și modelele, cu atât aplicațiile lor sunt mai cuprinzătoare și mai generice.
- Putere de calcul: sunt necesare resurse de calcul semnificative, în special în timpul creării modelelor lingvistice, în care calculul de înaltă performanță și infrastructurile robuste de cloud sunt esențiale.
- Expertiză umană: LT de succes implică colaborarea dintre lingviști, oameni de știință în domeniul datelor, ingineri de calculatoare și specialiști în domeniu.
Ce face Europa pentru a dezvolta tehnologiile lingvistice?
În Europa, avem un peisaj lingvistic complex. Carta drepturilor fundamentale a Uniunii Europene interzice discriminarea pe motive de limbă și impune UE obligația de a respecta diversitatea lingvistică. Responsabilitatea, transparența, corectitudinea și respectarea valorilor noastre sunt doar câteva dintre implicațiile sale etice. Aceste drepturi și principii pot fi garantate numai printr-o utilizare imparțială a LT.
Industria europeană a LT joacă un rol esențial în autonomia strategică și tehnologică a Europei, care ar trebui consolidată în continuare. Nevoile noastre specifice de piață sunt cel mai bine cunoscute de furnizorii europeni de servicii de traducere electronică, dintre care sute sunt enumerate în Catalogul serviciilor de traducere electronică.
Soluțiile disponibile public, inclusiv instrumentele și serviciile oferite de Comisia Europeană, completează oferta de pe piață, abordând în același timp o deficiență în ceea ce privește sprijinul tehnologic pentru limbile cu resurse reduse. Aceste soluții de bază – traducerea automată (eTranslation), recunoașterea entităților, rezumarea, transcrierea vorbirii și pseudonimizarea datelor pentru conformitatea cu RGPD – sunt disponibile tuturor administrațiilor publice europene și întreprinderilor mici și mijlocii în toate limbile oficiale.
În cadrul programului Orizont 2020, Rețeaua lingvistică europeană (ELG) a creat un ghișeu unic pentru soluții specializate de învățare pe tot parcursul vieții. Eforturile de diseminare și de consolidare a comunității au contribuit la promovarea unei înțelegeri comune cu privire la necesitatea de a se alătura forțelor publice și private și de a beneficia de cele mai bune rezultate din ambele lumi în ceea ce privește cercetarea și desfășurarea.
Programul Orizont Europa promovează cercetarea și inovarea prin sprijinirea dezvoltării unor tehnici de învățare pe tot parcursul vieții avansate și de ultimă generație, inclusiv a unor modele lingvistice de mari dimensiuni. Aceste modele, concepute pentru a spori interacțiunea om-mașină, vor avea capacități multilingve, vor gestiona mai multe moduri de intrare, vor gestiona prejudecățile și vor prezenta conștientizarea contextului.
Inițiativa privind egalitatea lingvistică europeană (ELE), un proiect-pilot/o acțiune pregătitoare inițiată de Parlamentul European, a elaborat o agendă și o foaie de parcurs pentru realizarea egalității depline a limbilor digitale în Europa până în 2030.
În cadrul programului de politică privind deceniul digital, Comisia coordonează un efort al Uniunii în toate statele membre și în sectorul privat pentru a dezvolta un ecosistem european al tehnologiilor pe termen lung.
În cele din urmă, Comisia recunoaște valoarea datelor lingvistice ca bază pentru formarea modelelor lingvistice prin intermediul spațiului european comun al datelor lingvistice (SDL). Finanțat în cadrul programului de lucru DIGITAL pentru perioada 2021-2022, proiectul urmărește să implementeze o platformă și o piață pentru colectarea, partajarea și reutilizarea datelor lingvistice multilingve și multimodale. Aliniere la Strategia europeană privind datele și la însuși conceptul de spații ale datelor, aceasta va asigura disponibilitatea unui număr mai mare de date lingvistice pentru a fi utilizate în economie, societate și cercetare, menținând în același timp controlul asupra întreprinderilor și persoanelor care generează datele.
Reunirea tuturor acestor elemente, proiecte și actori reprezintă o provocare majoră pentru Uniune, industria europeană și administrațiile publice naționale – scopul final fiind de a sprijini deceniul digital al Europei în beneficiul tuturor.
Ultimele știri

Comisia salută lansarea Consorțiului pentru o infrastructură digitală europeană (ALT-EDIC) și a spațiului de date lingvistice (LDS).

The Commission has selected a consortium that will develop ‘Simpl' – a secure middleware platform that will support data access and interoperability among European data spaces, unleashing the power of data-driven innovation.

Comisia a selectat un consorțiu care va dezvolta „Simpl” – o platformă middleware securizată care va sprijini accesul la date și interoperabilitatea între spațiile europene ale datelor, eliberând puterea inovării bazate pe date.

Comisia a adoptat o recomandare privind domeniile tehnologice critice pentru securitatea economică a UE, în vederea unei evaluări suplimentare a riscurilor împreună cu statele membre.
Conținut asociat
Imaginea de ansamblu
Aprofundați subiectul
-

UE sprijină cercetarea, inovarea și implementarea tehnologiilor lingvistice pentru a elimina...
Tehnologii lingvistice și multilingvism

Incluziunea digitală este un efort la nivelul UE pentru a se asigura că toată lumea poate contribui...

Datele sunt peste tot și cresc într-un ritm fără precedent. Pentru a valorifica pe deplin...