Jazykové technologie otevírají bránu do propojenější, inovativnější a přístupnější Evropy.
Jazykové technologie (LT) umožňují strojům nejen číst, analyzovat, zpracovávat a vytvářet lidský jazyk, ale také díky nedávnému vědeckému pokroku překlenout propast mezi lidskou komunikací a strojovým porozuměním.
Vzhledem k tomu, že jazyk slouží jako základní médium pro lidskou interakci, LT získalo obrovský význam v různých odvětvích a aplikacích, od překladů a lokalizace až po zákaznickou podporu, zdravotní péči, tvorbu médií a marketing. Mezi běžné příklady této technologie patří rozpoznávání řeči, inteligentní asistenti, strojový překlad, chatboty, sumarizace textu a automatické titulkování.
Co je potřeba k rozvoji jazykových technologií?
Níže jsou uvedeny některé z klíčových prvků pro rozvoj jazykových nástrojů a služeb.
- Jazykové údaje: jedná se o textový nebo mluvený obsah – v jednom nebo více jazycích – který slouží jako vstupní nebo školicí materiál pro úlohy zpracování přirozeného jazyka, např. generování textu nebo analýzu sentimentu. Tyto údaje mohou pocházet z různých zdrojů – knih, článků, příspěvků na sociálních sítích, přepisů mluvených rozhovorů atd. Vzhledem k tomu, že tvoří základ rozvoje LT, je nezbytné, aby byly shromažďovány při plném dodržování ustanovení o autorském právu (IPR) a ochraně osobních údajů (GDPR).
- Tréninkové algoritmy a jazykové modely: algoritmy jsou software, „recepty“, které vytvářejí modely lidských jazyků. Díky značnému množství kvalitních dat prokázaly nejnovější algoritmy strojového učení zvýšené schopnosti vytvářet modely reprezentující znalosti odvozené z jazykových dat. Čím větší jsou zdroje a modely, tím širší a obecnější jsou jejich aplikace.
- Výpočetní výkon: jsou zapotřebí významné výpočetní prostředky, zejména při vytváření jazykových modelů, kde jsou klíčové vysoce výkonné výpočetní a robustní cloudové infrastruktury.
- Lidská odbornost: úspěšné LT zahrnuje spolupráci mezi lingvisty, datovými vědci, počítačovými inženýry a doménovými specialisty.
Co dělá Evropa pro rozvoj jazykových technologií?
V Evropě máme komplexní jazykovou krajinu. Listina základních práv Evropské unie zakazuje diskriminaci na základě jazyka a ukládá EU povinnost respektovat jazykovou rozmanitost. Odpovědnost, transparentnost, spravedlnost a dodržování našich hodnot jsou jen některé z jejích etických důsledků. Tato práva a zásady mohou být zaručeny pouze nezaujatým použitím LT.
Evropský průmysl LT hraje klíčovou úlohu ve strategické a technologické autonomii Evropy, která by měla být dále posílena. Naše specifické potřeby trhu jsou nejlépe známy evropskými LT providers, z nichž stovky jsou uvedeny v Katalogu služeb eTranslation.
Veřejně dostupná řešení, včetně nástrojů a služeb nabízených Evropskou komisí, doplňují tržní nabídku a zároveň řeší nedostatky v technologické podpoře jazyků s nízkými zdroji. Tato základní řešení – strojový překlad (eTranslation), rozpoznávání pojmenovaných entit, sumarizace, přepis řeči a pseudonymizace dat pro dodržování GDPR – jsou k dispozici všem evropským orgánům veřejné správy a malým a středním podnikům ve všech úředních jazycích.
V rámci programu Horizont 2020 vytvořila evropská jazyková síť (ELG) jednotné kontaktní místo specializovaných LT řešení. Úsilí v oblasti šíření a budování komunit přispělo k podpoře společného chápání nutnosti spojit se s veřejnými a soukromými silami a těžit z toho nejlepšího z obou světů v oblasti výzkumu a zavádění.
Program Horizont Evropa podporuje výzkum a inovace podporou rozvoje nad rámec nejmodernějších pokročilých LT, včetně velkých jazykových modelů. Tyto modely, které mají zlepšit interakci mezi člověkem a strojem, budou mít mnohojazyčné schopnosti, budou zpracovávat více režimů vstupu, řídit předsudky a vykazovat kontextové povědomí.
Iniciativa Evropská jazyková rovnost (ELE), pilotní projekt/přípravná akce zahájená Evropským parlamentem, vypracovala agendu a plán pro dosažení plné digitální jazykové rovnosti v Evropě do roku 2030.
V rámci programu politiky digitální dekády Komise koordinuje úsilí Unie ve všech členských státech a soukromém sektoru o vytvoření evropského ekosystému LT.
Vneposlední řadě Komise uznává hodnotu jazykových údajů jako základ pro jazykové modely odborné přípravy prostřednictvím společného evropského jazykového datového prostoru (LDS). Projekt je financován v rámci pracovního programu DIGITAL na období 2021–2022 a jeho cílem je zavést platformu a tržiště pro shromažďování, sdílení a opakované použití vícejazyčných a multimodálních jazykových dat. V souladu s evropskou strategií pro data a samotným konceptem datových prostorů zajistí, aby bylo k dispozici více jazykových údajů pro použití v ekonomice, společnosti a výzkumu, a zároveň udržet podniky a jednotlivce, kteří data generují, pod kontrolou.
Spojení všech těchto prvků, projektů a aktérů je velkou výzvou pro Unii, evropský průmysl a vnitrostátní orgány veřejné správy – konečným cílem je podpora digitální dekády Evropy ve prospěch všech.
Nejnovější zprávy
Související obsah
Souvislosti
Hlubší pohled
-
EU podporuje výzkum, inovace a zavádění jazykových technologií s cílem odstranit jazykové bariéry a zároveň zachovat a podporovat mnohojazyčnost.
Jazykové technologie a mnohojazyčnost

Digitální začleňování je celoevropským úsilím o zajištění toho, aby každý mohl přispívat k...

Data jsou všude a rostou bezprecedentním tempem. Komise vypracovala evropskou datovou strategii...