Skip to main content
Shaping Europe’s digital future

Kalbos technologijos

Kalbų technologijos atveria vartus į labiau sujungtą, novatoriškesnę ir prieinamesnę Europą.

    Vaizdinis kalbos ir technologijų reprezentavimas: kištukinių lizdų, prie kurių prijungiamas kabelis, pasirinkimas, kiekvienas iš jų vaizduojamas vėliava

©Getty Images/iStock

Kalbos technologijos (LT) leidžia mašinoms ne tik skaityti, analizuoti, apdoroti ir generuoti žmogaus kalbą, bet ir, naujausių mokslo laimėjimų dėka, įveikti atotrūkį tarp žmogaus bendravimo ir mašinų supratimo.

Kadangi kalba yra pagrindinė žmogaus bendravimo priemonė, LT įgijo didžiulę reikšmę įvairiose pramonės šakose ir taikomosiose programose, nuo vertimo ir lokalizavimo iki klientų aptarnavimo, sveikatos priežiūros, žiniasklaidos kūrimo ir rinkodaros. Bendri šios technologijos pavyzdžiai yra kalbos atpažinimas, išmanieji padėjėjai, mašininis vertimas, pokalbių robotai, teksto apibendrinimas ir automatinis subtitravimas.

Ko reikia norint sukurti kalbos technologijas?

Toliau pateikiami kai kurie pagrindiniai elementai, padedantys kurti kalbines priemones ir paslaugas.

  • Kalbos duomenys: tai tekstinis arba šnekamasis turinys viena ar keliomis kalbomis, kuris naudojamas kaip natūralios kalbos apdorojimo užduočių, pvz., tekstų generavimo ar sentimentų analizės, įvesties arba mokymo medžiaga. Šie duomenys gali būti gaunami iš įvairių šaltinių – knygų, straipsnių, socialinės žiniasklaidos pranešimų, pokalbių stenogramų ir t.t.
  • Mokymo algoritmai ir kalbų modeliai: algoritmai yra programinė įranga, „receptai“, skirti žmonių kalbų modeliams kurti. Naujausi mašinų mokymosi algoritmai su dideliais kokybės duomenų kiekiais parodė didesnius gebėjimus kurti modelius, atspindinčius žinias, gautas iš kalbos duomenų. Kuo didesni ištekliai ir modeliai, tuo platesnis ir bendrinis jų taikymas yra.
  • Skaičiavimo galia: reikalingi dideli skaičiavimo ištekliai, ypač kuriant kalbų modelius, kuriuose itin svarbi našioji kompiuterija ir patikima debesijos infrastruktūra.
  • Žmogiškoji patirtis: sėkmingas LT apima lingvistų, duomenų mokslininkų, kompiuterių inžinierių ir sričių specialistų bendradarbiavimą.

Ką Europa daro kurdama kalbų technologijas?

Europoje turime sudėtingą kalbų kraštovaizdį. Europos Sąjungos pagrindinių teisių chartijoje draudžiama diskriminacija dėl kalbos ir ES įpareigojama gerbti kalbų įvairovę. Atskaitomybė, skaidrumas, sąžiningumas ir pagarba mūsų vertybėms yra tik keletas jų etinių pasekmių. Šias teises ir principus galima užtikrinti tik nešališkai naudojant LT.

Europos technologijų pramonė atlieka svarbų vaidmenį užtikrinant Europos strateginį ir technologinį savarankiškumą, kuris turėtų būti toliau stiprinamas. Mūsų specifinius rinkos poreikius geriausiai žino „European LT providers“, iš kurių šimtai išvardyti „ eTranslation Services“ kataloge.

Viešai prieinami sprendimai, įskaitant Europos Komisijossiūlomaspriemones ir paslaugas, papildo rinkos pasiūlą, kartu šalinant nepakankamą technologinę paramą mažai išteklių turinčioms kalboms. Visos Europos viešojo administravimo institucijos ir mažosios ir vidutinės įmonės visomis oficialiosiomis kalbomis gali naudotis šiais pagrindiniais sprendimais – mašininiu vertimu („eTranslation“), pavadinto subjekto pripažinimu, apibendrinimu, kalbos transkripcija ir duomenų pseudonimų suteikimu siekiant laikytis BDAR.

Pagal programą „Horizontas 2020Europos kalbų tinklas (ELG) sukūrė vieno langelio principu veikiantį specializuotų LT sprendimų centrą. Pastangos skleisti informaciją ir kurti bendruomenes padėjo skatinti bendrą supratimą apie būtinybę prisijungti prie viešųjų ir privačiųjų pajėgų ir pasinaudoti geriausiais abiejų pasaulių mokslinių tyrimų ir dislokavimo privalumais.

Programa „Europos horizontas“ skatinami moksliniai tyrimai ir inovacijos, remiant pažangiausių technologijų, įskaitant didelės kalbos modelius, plėtrą. Šie modeliai, skirti žmogaus ir mašinos sąveikai stiprinti, turės daugiakalbes galimybes, valdys įvairius įvesties būdus, valdys šališkumą ir parodys konteksto suvokimą.

Įgyvendinant Europos kalbų lygybės (ELE) iniciatyvą, Europos Parlamento inicijuotą bandomąjį projektą/parengiamuosius veiksmus, parengta darbotvarkė ir veiksmų gairės, kaip iki 2030 m. užtikrinti visišką skaitmeninių kalbų lygybę Europoje.

Pagal Skaitmeninio dešimtmečio politikos programą Komisija koordinuoja Sąjungos pastangas visose valstybėse narėse ir privačiajame sektoriuje plėtoti Europos LT ekosistemą.

Galiausiai Komisija pripažįsta kalbos duomenų, kaip kalbos modelių mokymo per bendrą Europos kalbų duomenų erdvę (LDS), pagrindą. Projekto, finansuojamo pagal 2021–2022 m. skaitmeninę darbo programą, tikslas – sukurti daugiakalbių ir daugiarūšių kalbų duomenų rinkimo, dalijimosi jais ir pakartotinio naudojimo platformą ir prekyvietę. Suderinta su Europos duomenų strategija ir pačia duomenų erdvių koncepcija, ja bus užtikrinta, kad ekonomikoje, visuomenėje ir moksliniuose tyrimuose būtų galima naudotis daugiau kalbos duomenų, kartu išlaikant duomenis generuojančių įmonių ir asmenų kontrolę.

Visų šių elementų, projektų ir dalyvių sujungimas yra didelis iššūkis Sąjungai, Europos pramonei ir nacionalinėms viešojo administravimo institucijoms, kurio galutinis tikslas – remti Europos skaitmeninį dešimtmetį visų labui.

Naujausios naujienos

Daugiau šia tema

Bendras vaizdas

Dirbtinis intelektas

ES siekia sukurti patikimą dirbtinį intelektą (DI), kuris teikia pirmenybę žmonėms.

Išsamiau

Kalbų technologijos ir daugiakalbystė

ES remia mokslinius tyrimus, inovacijas ir kalbų technologijų diegimą, kad būtų pašalintos kalbos kliūtys, kartu išsaugant ir skatinant daugiakalbystę.

Taip pat žr.

Di gamyklos

Di gamyklos naudojasi bendrosios įmonės „EuroHPC“ superkompiuterijos pajėgumais, kad sukurtų patikimus pažangiausius generacinio dirbtinio intelekto modelius.

Europos dirbtinio intelekto biuras

Europos dirbtinio intelekto biuras bus dirbtinio intelekto kompetencijos centras visoje ES. Ji atliks svarbų vaidmenį įgyvendinant DI aktą, ypač bendrosios paskirties DI srityje, skatins patikimo dirbtinio intelekto kūrimą ir naudojimą, taip pat tarptautinį bendradarbiavimą.

Robotų technika

ES aktyviai skatina mokslinius tyrimus, darbo vietų kūrimą ir inovacijas pasitelkdama geresnius ir saugesnius robotus, kartu užtikrindama pasiektos pažangos etinius aspektus.

Europos požiūris į dirbtinį intelektą

ES požiūris į dirbtinį intelektą yra kompetencijos ir pasitikėjimo centras, kuriuo siekiama skatinti mokslinius tyrimus ir pramonės pajėgumus, kartu užtikrinant saugą ir pagrindines teises.

Kalbos technologijos ir daugiakalbystė

E. įtrauktis

E. įtrauktis – tai visos ES masto pastangos užtikrinti, kad kiekvienas galėtų prisidėti prie...

Duomenys

Duomenys yra visur ir auga precedento neturinčiu tempu. Komisija parengė Europos duomenų strategiją...