A projekt a következőkből áll:
- tanulmány a meglévő automatizált beszédfelismerő megoldásokról és a képzési adatok elérhetőségéről (beszéd és kapcsolódó átírás);
- nyílt forráskódú beszédfelismerő alapprototípus-megoldás létrehozása;
- a képzési adatok új gyűjtése (beszéd és a kapcsolódó átírás).
A tanulmány többek között választ ad ezekre a kérdésekre:
- Jelenleg milyen típusú automatizált beszédfelismerő megoldások vannak forgalomban?
- Hogyan fejlesztik ki ezeket a megoldásokat? Milyen szakértői ismeretekre, adatokra, költségvetésre, infrastruktúrára és számítástechnikai teljesítményre van szükségük?
- Milyen kritériumok alapján lehet a megoldásokat értékelni és összehasonlítani egymással?
- Melyek a technika jelenlegi állása és az e megoldások által elért eredmények,
- Melyek a jövőbeli technológiai fejlesztésekre vonatkozó előrejelzések?
- Milyen piacok léteznek ma az automatizált beszédfelismerő megoldások számára?
- Kik a beszállítók, márkák/termékek, vevők/felhasználók és alkalmazások, és mekkora piaci részesedésük van Európában és világszerte?
- Melyek a piac jövőjére vonatkozó előrejelzések?
A nyílt forráskódú beszédfelismerő alapprototípus megoldás az alacsony forráskódú uniós hivatalos nyelvekre terjed ki, legalább egy észak-, kelet- és dél-európai nyelvvel, amelyet a közbeszerzéshez kapcsolódó adatgyűjtési tevékenységek támogatnak.
A projekt finanszírozása a nyelvi technológiák területén a DIGITAL Europe programot végrehajtó 2022. évi nyelvi technológiai megoldásokra vonatkozó ajánlati felhívás keretében történik.