Projekt bude pozostávať z:
- štúdia o existujúcich riešeniach automatického rozpoznávania reči a dostupnosti údajov o odbornej príprave (reč a súvisiaci prepis);
- vytvorenie prototypu základného rozpoznávania reči s otvoreným zdrojovým kódom;
- nový súbor trénovacích údajov (prejav a súvisiaci prepis).
Štúdia okrem iného poskytne odpovede na tieto otázky:
- Aké typy riešení automatického rozpoznávania reči sú v súčasnosti na trhu?
- Ako sa tieto riešenia vyvíjajú? Aké odborné znalosti, údaje, rozpočet, infraštruktúra a výpočtová kapacita potrebujú?
- Podľa akých kritérií možno tieto riešenia posudzovať a porovnávať?
- Aký je súčasný stav techniky a výsledky dosiahnuté týmito riešeniami,
- Aké sú prognózy budúceho technologického vývoja?
- Aké trhy v súčasnosti existujú pre riešenia na automatické rozpoznávanie reči?
- Kto sú dodávatelia, značky/výrobky, kupujúci/používatelia a aplikácie a aké sú ich podiely na trhu v Európe a na celom svete?
- Aké sú predpovede týkajúce sa budúcnosti tohto trhu?
Prototyp základného rozpoznávania reči s otvoreným zdrojovým kódom sa bude vzťahovať na úradné jazyky EÚ s nízkymi zdrojmi, pričom aspoň jeden jazyk zo severnej, východnej a južnej Európy bude podporený činnosťami zberu údajov spojenými s obstarávaním.
Projekt je financovaný v rámci výzvy na predkladanie ponúk v oblasti jazykových technológií na rok 2022, ktorou sa realizuje program DIGITAL Europe v oblasti jazykových technológií.