Projekt bo vključeval:
- študijo o obstoječih rešitvah za samodejno prepoznavanje govora in razpoložljivosti učnih podatkov (govor in s tem povezan prepis);
- oblikovanje odprtokodne osnovne rešitve za prepoznavanje govora;
- nova zbirka podatkov o usposabljanju (govor in s tem povezan prepis).
Študija bo med drugim zagotovila odgovore na ta vprašanja:
- Katere vrste rešitev za samodejno prepoznavanje govora so trenutno na trgu?
- Kako se te rešitve razvijajo? Katero strokovno znanje, podatke, proračun, infrastrukturo, računalniško zmogljivost potrebujejo?
- Po katerih merilih je mogoče oceniti in primerjati rešitve?
- Kakšna je najsodobnejša tehnologija in rezultati, doseženi s temi rešitvami,
- Kakšne so napovedi za prihodnji tehnološki razvoj?
- Kateri trgi so danes na voljo za rešitve za samodejno prepoznavanje govora?
- Kdo so dobavitelji, blagovne znamke/proizvodi, kupci/uporabniki in aplikacije ter kakšni so njihovi tržni deleži v Evropi in po svetu?
- Kakšne so napovedi o prihodnosti tega trga?
Odprtokodna osnovna prototipna rešitev za prepoznavanje govora bo zajemala nizkovirne uradne jezike EU z vsaj enim jezikom iz severne, vzhodne in južne Evrope, podprt z dejavnostmi zbiranja podatkov, povezanimi z javnim naročanjem.
Projekt se financira v okviru razpisa za jezikovne tehnološke rešitve za leto 2022, s katerim se izvaja program DIGITAL Europe na področju jezikovnih tehnologij.