Projekt będzie obejmował:
- badanie dotyczące istniejących rozwiązań w zakresie zautomatyzowanego rozpoznawania mowy i dostępności danych treningowych (mowa i związana z tym transkrypcja);
- stworzenie prototypowego prototypu otwartego oprogramowania w zakresie rozpoznawania mowy;
- nowy zbiór danych szkoleniowych (mowa i związana z nim transkrypcja).
Badanie dostarczy m.in. odpowiedzi na te pytania:
- Jakie rodzaje rozwiązań w zakresie zautomatyzowanego rozpoznawania mowy są obecnie dostępne na rynku?
- W jaki sposób opracowuje się te rozwiązania? Jakiej wiedzy specjalistycznej, danych, budżetu, infrastruktury i mocy obliczeniowej potrzebują?
- Według jakich kryteriów rozwiązania mogą być oceniane i porównywane ze sobą?
- Jaki jest aktualny stan wiedzy i wyniki osiągnięte dzięki tym rozwiązaniom?
- Jakie są prognozy dotyczące przyszłego rozwoju technologii?
- Jakie rynki obecnie istnieją dla rozwiązań w zakresie zautomatyzowanego rozpoznawania mowy?
- Kim są dostawcy, marki/produkty, nabywcy/użytkownicy i aplikacje oraz jakie są ich udziały w rynku w Europie i na świecie?
- Jakie są prognozy dotyczące przyszłości tego rynku?
Podstawowe rozwiązanie w zakresie rozpoznawania mowy oparte na otwartym oprogramowaniu będzie obejmować mało zasobne języki urzędowe UE, w których co najmniej jeden język z Europy Północnej, Wschodniej i Południowej będzie wspierany przez działania związane z gromadzeniem danych związane z zamówieniami publicznymi.
Projekt jest finansowany w ramach zaproszenia do składania ofert dotyczących rozwiązań w dziedzinie technologii językowych z 2022 r., wdrażającego program DIGITAL Europe w dziedzinie technologii językowych.