Projekt će se sastojati od:
- studiju o postojećim rješenjima za automatsko prepoznavanje govora i dostupnosti podataka o osposobljavanju (govor i povezana transkripcija);
- stvaranje prototipa za prepoznavanje govora otvorenog koda;
- novo prikupljanje podataka o osposobljavanju (govor i povezana transkripcija).
Studija će, među ostalim, pružiti odgovore na sljedeća pitanja:
- Koje su vrste rješenja za automatsko prepoznavanje govora trenutačno na tržištu?
- Kako se ta rješenja razvijaju? Koja su im stručna znanja, podaci, proračun, infrastruktura, računalna snaga potrebna?
- Prema kojim se kriterijima rješenja mogu procijeniti i usporediti?
- Koja su najnovija dostignuća i rezultati koji su danas postignuti tim rješenjima,
- Koja su predviđanja budućeg tehnološkog razvoja?
- Koja tržišta danas postoje za rješenja za automatsko prepoznavanje govora?
- Tko su dobavljači, robne marke/proizvodi, kupci/korisnici i aplikacije i koji su njihovi tržišni udjeli u Europi i svijetu?
- Koja su predviđanja o budućnosti tog tržišta?
Prototip za prepoznavanje govora otvorenog koda obuhvaćat će službene jezike EU-a s niskim resursima s najmanje jednim jezikom iz sjeverne, istočne i južne Europe uz potporu aktivnosti prikupljanja podataka povezanih s javnom nabavom.
Projekt se financira u okviru poziva na podnošenje ponuda za jezična tehnološka rješenja za 2022. kojim se provodi program DIGITAL Europe u području jezičnih tehnologija.