Projektet vil bestå af:
- en undersøgelse af eksisterende automatiserede talegenkendelsesløsninger og tilgængeligheden af uddannelsesdata (tale og relateret transskription)
- skabelse af en open source-baseret prototypeprototypeløsning til talegenkendelse
- en ny indsamling af uddannelsesdata (tale og tilknyttet transskription).
Undersøgelsen vil bl.a. give svar på disse spørgsmål:
- Hvilke typer automatiserede talegenkendelsesløsninger findes der i øjeblikket på markedet?
- Hvordan udvikles disse løsninger? Hvilken ekspertviden, data, budget, infrastruktur og computerkraft har de brug for?
- Efter hvilke kriterier kan løsningerne vurderes og sammenlignes med hinanden?
- Hvad er det aktuelle tekniske niveau og de resultater, der er opnået med disse løsninger i dag
- Hvad er forudsigelserne for den fremtidige teknologiske udvikling?
- Hvilke markeder findes der i dag for automatiserede talegenkendelsesløsninger?
- Hvem er leverandører, mærker/produkter, købere/brugere og applikationer, og hvad er deres markedsandele i Europa og globalt?
- Hvad er forudsigelserne om fremtiden for dette marked?
Open source-prototypeløsningen til grundlæggende talegenkendelse vil omfatte EU's lavressourcesprog med mindst ét sprog fra Nord-, Øst- og Sydeuropa, der understøttes af dataindsamlingsaktiviteterne i forbindelse med udbuddet.
Projektet finansieres under 2022-indkaldelsen af tilbud om sprogteknologiløsninger, der gennemfører DIGITAL Europa-programmet inden for sprogteknologi.