Projekt bude sestávat z:
- studie o stávajících automatizovaných řešeních rozpoznávání řeči a dostupnosti tréninkových údajů (projev a související přepis);
- vytvoření prototypového řešení pro rozpoznávání řeči s otevřeným zdrojovým kódem;
- nový soubor tréninkových dat (projev a související přepis).
Studie mimo jiné poskytne odpovědi na tyto otázky:
- Jaké typy řešení automatického rozpoznávání řeči jsou v současné době na trhu?
- Jak se tato řešení vyvíjejí? Jaké odborné znalosti, data, rozpočet, infrastruktura a výpočetní výkon potřebují?
- Podle jakých kritérií lze řešení posuzovat a porovnávat?
- Jaký je současný stav techniky a výsledky dosažené díky těmto řešením,
- Jaké jsou prognózy budoucího technologického vývoje?
- Jaké trhy dnes existují pro automatizované rozpoznávání řeči?
- Kdo jsou dodavatelé, značky/výrobky, kupující/uživatelé a aplikace a jaké jsou jejich podíly na trhu v Evropě a na celém světě?
- Jaké jsou prognózy týkající se budoucnosti tohoto trhu?
Prototyp základního rozpoznávání řeči s otevřeným zdrojovým kódem se bude vztahovat na úřední jazyky EU s nízkými zdroji, přičemž alespoň jeden jazyk ze severní, východní a jižní Evropy bude podporován shromažďováním údajů v souvislosti se zadáváním veřejných zakázek.
Projekt je financován v rámci výzvy k podávání nabídek pro jazyková technologická řešení 2022, kterou se provádí program DIGITAL Europe v oblasti jazykových technologií.