Jazykové technologie otevírají bránu k propojenější, inovativnější a přístupnější Evropě.
Jazykové technologie (LT) umožňují strojům nejen číst, analyzovat, zpracovávat a generovat lidský jazyk, ale také díky nedávnému vědeckému pokroku překlenout propast mezi lidskou komunikací a strojovým porozuměním.
Vzhledem k tomu, že jazyk slouží jako základní médium pro lidskou interakci, LT získala obrovský význam v různých odvětvích a aplikacích, od překladu a lokalizace až po zákaznickou podporu, zdravotní péči, tvorbu médií a marketing. Běžnými příklady této technologie jsou rozpoznávání řeči, inteligentní asistenti, strojový překlad, chatboti, sumarizace textu a automatické titulkování.
Co je zapotřebí k rozvoji jazykových technologií?
Níže jsou uvedeny některé z klíčových prvků pro vývoj jazykových nástrojů a služeb.
- Jazykové údaje: jedná se o textový nebo mluvený obsah – v jednom nebo více jazycích –, který slouží jako vstupní nebo školicí materiál pro úkoly zpracování přirozeného jazyka, např. generování textu nebo analýza sentimentu. Tyto údaje mohou pocházet z různých zdrojů – knih, článků, příspěvků na sociálních médiích, přepisů mluvených rozhovorů atd. Vzhledem k tomu, že tvoří základ vývoje jazykových technologií, je nezbytné, aby byly shromažďovány při plném dodržování ustanovení o autorském právu a ochraně osobních údajů.
- Algoritmy odborné přípravy a jazykové modely: algoritmy jsou software, „recepty“, které vytvářejí modely lidských jazyků. Díky značnému množství kvalitních dat prokázaly nejnovější algoritmy strojového učení zvýšené schopnosti vytvářet modely reprezentující znalosti odvozené z jazykových dat. Čím větší jsou zdroje a modely, tím širší a obecnější jsou jejich aplikace.
- Výpočetní výkon: jsou zapotřebí značné výpočetní zdroje, zejména při vytváření jazykových modelů, kde mají vysoce výkonná výpočetní technika a robustní cloudové infrastruktury zásadní význam.
- Odborné znalosti v oblasti lidských zdrojů: Úspěšné LT zahrnují spolupráci mezi lingvisty, datovými vědci, počítačovými inženýry a specialisty na domény.
Co dělá Evropa pro rozvoj jazykových technologií?
V Evropě máme komplexní jazykovou krajinu. Listina základních práv Evropské unie zakazuje diskriminaci na základě jazyka a ukládá EU povinnost respektovat jazykovou rozmanitost. Odpovědnost, transparentnost, spravedlnost a respektování našich hodnot jsou jen některé z jejich etických důsledků. Tato práva a zásady mohou být zaručeny pouze nestranným používáním LT.
Evropské odvětví LT hraje klíčovou úlohu ve strategické a technologické autonomii Evropy, která by měla být dále posílena. Naše specifické potřeby na trhu nejlépe znají evropští poskytovatelé služeb elektronických překladů, z nichž stovky jsou uvedeny v Katalogu služeb elektronických překladů.
Veřejně dostupná řešení, včetně nástrojů a služeb nabízených Evropskou komisí, doplňují nabídku na trhu a zároveň řeší nedostatek technologické podpory jazyků s nízkými zdroji. Tato základní řešení – strojový překlad (eTranslation), rozpoznávání jmenovitých subjektů, sumarizace, přepis řeči a pseudonymizace údajů pro účely dodržování obecného nařízení o ochraně osobních údajů – jsou k dispozici všem evropským orgánům veřejné správy a malým a středním podnikům ve všech úředních jazycích.
V rámci programu Horizont 2020 vytvořila Evropská jazyková síť (ELG) jednotné kontaktní místo pro specializovaná řešení v oblasti jazykových technologií. Úsilí o šíření výsledků a budování komunit přispělo k podpoře společného porozumění, pokud jde o nutnost připojit se k veřejným a soukromým silám a těžit z toho nejlepšího z obou světů v oblasti výzkumu a zavádění.
Program Horizont Evropa podporuje výzkum a inovace prostřednictvím podpory rozvoje nejmodernějších pokročilých jazykových technologií, včetně velkých jazykových modelů. Tyto modely, navržené pro zlepšení interakce mezi člověkem a strojem, budou mít vícejazyčné schopnosti, zvládnou více režimů vstupu, zvládnou předsudky a projeví povědomí o kontextu.
Iniciativa Evropská jazyková rovnost (ELE), pilotní projekt/přípravná akce zahájená Evropským parlamentem, vypracovala agendu a plán pro dosažení plné digitální jazykové rovnosti v Evropě do roku 2030.
V rámci politického programu Digitální dekáda Komise koordinuje úsilí Unie ve všech členských státech a v soukromém sektoru o rozvoj evropského ekosystému jazykových technologií.
V neposlední řadě Komise uznává hodnotu jazykových údajů jako základu pro výuku jazykových modelů prostřednictvím společného evropského jazykového datového prostoru (LDS). Cílem projektu financovaného v rámci pracovního programu DIGITAL na období 2021–2022 je zavést platformu a tržiště pro shromažďování, sdílení a opakované použití vícejazyčných a multimodálních jazykových údajů. V souladu s evropskou strategií pro data a samotnou koncepcí datových prostorů zajistí, aby bylo k dispozici více jazykových dat pro použití v hospodářství, společnosti a výzkumu, přičemž podniky a jednotlivci, kteří data vytvářejí, budou mít kontrolu.
Spojení všech těchto prvků, projektů a aktérů je pro Unii, evropský průmysl a vnitrostátní orgány veřejné správy velkou výzvou – konečným účelem je podpořit evropskou digitální dekádu ve prospěch všech.
Nejnovější zprávy

Komise vítá založení Aliance pro jazykové technologie, konsorcia evropské digitální infrastruktury (ALT-EDIC) a jazykového datového prostoru (LDS).

The Commission has selected a consortium that will develop ‘Simpl' – a secure middleware platform that will support data access and interoperability among European data spaces, unleashing the power of data-driven innovation.

Komise vybrala konsorcium, které vyvine „Simpl“ – bezpečnou middlewarovou platformu, která podpoří přístup k datům a interoperabilitu mezi evropskými datovými prostory a uvolní sílu inovací založených na datech.

Komise přijala doporučení o kritických technologických oblastech pro hospodářskou bezpečnost EU za účelem dalšího posouzení rizik s členskými státy.
Související obsah
Souvislosti
Hlubší pohled
-

EU podporuje výzkum, inovace a zavádění jazykových technologií s cílem odstranit jazykové bariéry a...
Jazykové technologie a mnohojazyčnost

Digitální začleňování je celoevropskou snahou o zajištění toho, aby každý mohl přispívat do...

Data jsou všude a rostou nebývalým tempem. Aby bylo možné plně využít přínosů dat, přijala Komise...