Проектът ще се състои от:
- проучване на съществуващите решения за автоматизирано разпознаване на реч и наличието на данни за обучение (реч и свързаната с тях транскрипция);
- създаване на основно решение за разпознаване на реч с отворен код;
- ново събиране на данни за обучението (реч и съответната транскрипция).
Проучването ще предостави, наред с другото, отговори на тези въпроси:
- Какви видове решения за автоматично разпознаване на реч понастоящем се предлагат на пазара?
- Как се разработват тези решения? От какви експертни знания, данни, бюджет, инфраструктура, изчислителна мощност се нуждаят те?
- По какви критерии решенията могат да бъдат оценявани и сравнявани помежду си?
- Какво е съвременното технологично равнище и резултатите, постигнати от тези решения днес,
- Какви са прогнозите за бъдещото технологично развитие?
- Какви пазари съществуват днес за решения за автоматизирано разпознаване на реч?
- Кои са доставчиците, марките/продуктите, купувачите/потребителите и приложенията и какви са техните пазарни дялове в Европа и в световен мащаб?
- Какви са прогнозите за бъдещето на този пазар?
Основното решение за разпознаване на реч с отворен код ще обхване нискоресурсните официални езици на ЕС с поне един език от Северна, Източна и Южна Европа, подкрепен от дейностите по събиране на данни, свързани с обществената поръчка.
Проектът се финансира по покана за участие в търг за 2022 г. за решения в областта на езиковите технологии за изпълнение на програмата DIGITAL Europe в областта на езиковите технологии.