O projeto consistirá em :
- um estudo sobre as soluções existentes de reconhecimento automático da fala e a disponibilidade de dados de treino (fala e transcrição conexa);
- a criação de uma solução de protótipo de reconhecimento da fala de fonte aberta;
- uma nova recolha de dados de formação (fala e transcrição conexa).
O estudo dará, nomeadamente, respostas a estas perguntas :
- Que tipos de soluções automatizadas de reconhecimento de voz se encontram atualmente no mercado?
- Como são desenvolvidas estas soluções? Quais são os conhecimentos especializados, os dados, o orçamento, as infraestruturas e a capacidade computacional de que necessitam?
- De acordo com que critérios podem as soluções ser avaliadas e comparadas entre si?
- O que é o estado da técnica e os resultados alcançados atualmente por estas soluções,
- Quais são as previsões para futuros desenvolvimentos tecnológicos?
- Que mercados existem atualmente para soluções automatizadas de reconhecimento de voz?
- Quem são os fornecedores, marcas/produtos, compradores/utilizadores e aplicações e quais são as suas quotas de mercado na Europa e a nível mundial?
- Quais são as previsões sobre o futuro deste mercado?
A solução de protótipo de reconhecimento de fala de fonte aberta abrangerá línguas oficiais da UE com poucos recursos, com pelo menos uma língua da Europa do Norte, Oriental e Meridional apoiada pelas atividades de recolha de dados relacionadas com a contratação pública.
O projeto é financiado no âmbito do concurso de 2022 Soluções de Tecnologias Linguísticas que implementa o Programa DIGITAL Europa no domínio das tecnologias da linguagem.