Projektet kommer att bestå av följande:
- en studie om befintliga lösningar för automatiserad taligenkänning och tillgången till utbildningsdata (tal och tillhörande transkribering).
- skapande av en grundläggande prototyplösning för taligenkänning med öppen källkod.
- en ny samling utbildningsdata (tal och dithörande transkribering).
Studien kommer bland annat att ge svar på dessa frågor:
- Vilka typer av automatiska lösningar för taligenkänning finns för närvarande på marknaden?
- Hur utvecklas dessa lösningar? Vilka expertkunskaper, data, budget, infrastruktur och datorkraft behöver de?
- Enligt vilka kriterier kan lösningarna bedömas och jämföras med varandra?
- Vilken är den senaste tekniken och de resultat som uppnåtts genom dessa lösningar i dag?
- Vilka är prognoserna för den framtida tekniska utvecklingen?
- Vilka marknader finns i dag för automatiserade lösningar för taligenkänning?
- Vilka är leverantörer, varumärken/produkter, köpare/användare och tillämpningar och vilka är deras marknadsandelar i Europa och globalt?
- Vilka är prognoserna om denna marknads framtid?
Prototyplösningen för grundläggande taligenkänning med öppen källkod kommer att omfatta officiella EU-språk med begränsade resurser med minst ett språk från norra, östra och södra Europa som stöds av datainsamlingen i samband med upphandlingen.
Projektet finansieras inom ramen för 2022 års anbudsinfordran för språklösningar för genomförande av programmet DIGITAL Europa på området språkteknik.