Skip to main content
Shaping Europe’s digital future

Valodu tehnoloģijas

Valodu tehnoloģijas paver ceļu uz savienotāku, inovatīvāku un pieejamāku Eiropu.

Valodu tehnoloģijas (LT) ļauj mašīnām ne tikai lasīt, analizēt, apstrādāt un radīt cilvēka valodu, bet arī, pateicoties jaunākajiem zinātnes sasniegumiem, pārvarēt plaisu starp cilvēku komunikāciju un mašīnu izpratni.

Tā kā valoda ir cilvēka mijiedarbības pamatvide, LT ir ieguvusi milzīgu nozīmi dažādās nozarēs un lietojumprogrammās, sākot no tulkošanas un lokalizācijas līdz klientu atbalstam, veselības aprūpei, mediju radīšanai un mārketingam. Parastie šīs tehnoloģijas piemēri ir runas atpazīšana, viedie asistenti, mašīntulkošana, tērzēšanas roboti, teksta kopsavilkums un automātiska subtitrēšana.

Kas ir nepieciešams, lai attīstītu valodu tehnoloģijas?

Turpmāk ir izklāstīti daži no galvenajiem elementiem valodu rīku un pakalpojumu izstrādē.

  • Valodas dati: tas attiecas uz tekstuālu vai runātu saturu vienā vai vairākās valodās, kas kalpo kā ievadmateriāls vai mācību materiāls dabiskās valodas apstrādes uzdevumiem, piemēram, teksta radīšanai vai sentimenta analīzei. Šos datus var iegūt no dažādiem avotiem — grāmatām, rakstiem, sociālo mediju ierakstiem, mutvārdu sarunu norakstiem utt. Tā kā tas veido LT attīstības pamatu, ir svarīgi tos vākt, pilnībā ievērojot autortiesību (IPR) un personas datu aizsardzības (VDAR) noteikumus.
  • Apmācības algoritmi un valodu modeļi: algoritmi ir programmatūra, “receptes”, lai izveidotu cilvēka valodu modeļus. Ar ievērojamu daudzumu kvalitatīvu datu, jaunākie mašīnmācīšanās algoritmi ir parādījuši lielākas spējas izveidot modeļus, kas atspoguļo zināšanas, kas iegūtas no valodas datiem. Jo lielāki ir resursi un modeļi, jo aptverošāki un vispārīgāki ir to pielietojumi.
  • Skaitļošanas jauda: ir vajadzīgi ievērojami skaitļošanas resursi, jo īpaši valodu modeļu izveides laikā, kur izšķiroša nozīme ir augstas veiktspējas datošanai un stabilai mākoņdatošanas infrastruktūrai.
  • Cilvēku speciālās zināšanas: veiksmīga LT ietver sadarbību starp valodniekiem, datu zinātniekiem, datorinženieriem un domēnu speciālistiem.

Ko Eiropa dara, lai attīstītu valodu tehnoloģijas?

Eiropā mums ir sarežģīta valodu aina. Eiropas Savienības Pamattiesību harta aizliedz diskrimināciju valodas dēļ un uzliek ES pienākumu respektēt valodu daudzveidību. Pārskatatbildība, pārredzamība, taisnīgums un mūsu vērtību ievērošana ir tikai dažas no tās ētiskajām sekām. Šīs tiesības un principus var garantēt tikai ar objektīvu LT izmantošanu.

Eiropas LT rūpniecībai ir būtiska nozīme Eiropas stratēģiskajā un tehnoloģiskajā autonomijā, kas būtu vēl vairāk jāstiprina. Mūsu specifiskās tirgus vajadzības ir vislabāk zināmas European LT providers, no kuriem simtiem ir uzskaitīti eTranslation Services katalogā.

Publiski pieejami risinājumi, tostarp Eiropas Komisijaspiedāvātierīki un pakalpojumi, papildina tirgus piedāvājumu, vienlaikus novēršot trūkumus tehnoloģiju atbalstā valodām ar zemiem resursiem. Šie pamata risinājumi — mašīntulkošana (eTranslation), subjekta atzīšana, kopsavilkums, runas transkripcija un datu pseidonimizācija VDAR atbilstības nodrošināšanai — ir pieejami visām Eiropas publiskās pārvaldes iestādēm un mazajiem un vidējiem uzņēmumiem visās oficiālajās valodās.

Pamatprogrammas “Apvārsnis 2020” ietvaros Eiropas valodu tīkls (ELG) izveidoja specializētu LT risinājumu vienas pieturas aģentūru. Izplatīšanas un kopienas veidošanas centieni ir palīdzējuši veicināt vienotu izpratni par nepieciešamību apvienot publiskos un privātos spēkus un gūt labumu no abu pasaules labāko pētniecības un izvēršanas.

Programma “Apvārsnis Eiropa” veicina pētniecību un inovāciju, atbalstot modernu, modernu LT, tostarp lielo valodu modeļu, izstrādi. Šiem modeļiem, kas izstrādāti, lai uzlabotu cilvēka un mašīnas mijiedarbību, būs daudzvalodīgas spējas, tie darbosies ar vairākiem ievades veidiem, pārvaldīs neobjektivitāti un parādīs kontekstu.

Eiropas valodu līdztiesības (ELE) iniciatīva, izmēģinājuma projekts/sagatavošanas darbība, ko ierosināja Eiropas Parlaments, izstrādāja programmu un ceļvedi pilnīgas digitālās valodu līdztiesības panākšanai Eiropā līdz 2030. gadam.

Digitālās desmitgades politikas programmas ietvaros Komisija koordinē Savienības centienus visās dalībvalstīs un privātajā sektorā izveidot Eiropas LT ekosistēmu.

Visbeidzot, Komisija atzīst valodu datu vērtību kā pamatu valodu modeļu apmācībai, izmantojot vienoto Eiropas valodu datu telpu (LDS). Projekta mērķis, ko finansē no DIGITAL darba programmas 2021.– 2022. gadam, ir izvērst platformu un platformu daudzvalodu un multimodālo valodas datu vākšanai, kopīgošanai un atkalizmantošanai. Saskaņā ar Eiropas Datu stratēģiju un pašu datu telpu koncepciju tā nodrošinās, ka vairāk valodas datu kļūst pieejami izmantošanai ekonomikā, sabiedrībā un pētniecībā, vienlaikus kontrolējot uzņēmumus un privātpersonas, kas rada datus.

Visu šo elementu, projektu un dalībnieku apvienošana ir liels izaicinājums Savienībai, Eiropas rūpniecībai un valstu pārvaldes iestādēm, un galīgais mērķis ir atbalstīt Eiropas digitālo desmitgadi visu labā.

Jaunākās ziņas

Līdzīgs saturs

Lielais attēls

Mākslīgais intelekts

ES mērķis ir veidot uzticamu mākslīgo intelektu (MI), kas priekšplānā izvirza cilvēkus.

Rociet dziļāk!

Valodu tehnoloģijas un daudzvalodība

ES atbalsta valodu tehnoloģiju pētniecību, inovāciju un ieviešanu, lai likvidētu valodu barjeras, vienlaikus saglabājot un veicinot daudzvalodību.

Skatīt arī

Eiropas Mākslīgā intelekta birojs

Eiropas MI birojs būs MI zinātības centrs visā ES. Tai būs svarīga loma MI akta īstenošanā, jo īpaši attiecībā uz vispārēja lietojuma MI, veicinot uzticama MI izstrādi un izmantošanu un starptautisko sadarbību.

Robotikas robotika

ES aktīvi veicina pētniecību, darbvietu radīšanu un inovāciju, izmantojot labākus un drošākus robotus, vienlaikus aizsargājot sasniegtā progresa ētiskos aspektus.

Eiropas pieeja mākslīgajam intelektam

ES pieeja mākslīgajam intelektam ir vērsta uz izcilību un uzticēšanos, un tās mērķis ir palielināt pētniecības un rūpniecības spējas, vienlaikus nodrošinot drošību un pamattiesības.

Valodu tehnoloģijas un daudzvalodība

Digitālā iekļaušana

Digitālā iekļaušana ir ES mēroga pasākums, ar ko nodrošina, ka ikviens var dot ieguldījumu...

Dati

Dati ir visur un pieaug nepieredzētā tempā. Komisija ir izstrādājusi Eiropas datu stratēģiju, lai...