Il progetto consisterà in:
- uno studio sulle soluzioni di riconoscimento vocale automatizzato esistenti e sulla disponibilità di dati di addestramento (vocale e relativa trascrizione);
- la creazione di una soluzione open source per il riconoscimento vocale di base;
- una nuova raccolta di dati di addestramento (voce e relativa trascrizione).
Lo studio fornirà, tra l'altro, risposte a queste domande:
- Quali tipi di soluzioni automatizzate di riconoscimento vocale sono attualmente sul mercato?
- Come vengono sviluppate queste soluzioni? Quali conoscenze specialistiche, dati, bilancio, infrastrutture, potenza di calcolo hanno bisogno?
- In base a quali criteri le soluzioni possono essere valutate e confrontate tra loro?
- Qual è lo stato dell'arte e i risultati ottenuti oggi da queste soluzioni,
- Quali sono le previsioni per i futuri sviluppi tecnologici?
- Quali mercati esistono oggi per le soluzioni automatizzate di riconoscimento vocale?
- Chi sono i fornitori, i marchi/prodotti, gli acquirenti/utenti e le applicazioni e quali sono le loro quote di mercato in Europa e nel mondo?
- Quali sono le previsioni sul futuro di questo mercato?
La soluzione open source per il riconoscimento vocale di base riguarderà le lingue ufficiali dell'UE a basso livello di risorse con almeno una lingua dell'Europa settentrionale, orientale e meridionale sostenuta dalle attività di raccolta dei dati connesse all'appalto.
Il progetto è finanziato nell'ambito del bando di gara 2022 "Soluzioni tecnologiche linguistiche " che attua il programma Europa DIGITAL nel settore delle tecnologie del linguaggio.