Ferramentas e recursos gratuitos para conversão texto-fala baseada em modelos ocultos de Markov no Português do Brasil.
Conversão texto-fala. Modelos ocultos de Markov. Português do Brasil. Código-livre.
A conversão texto-fala (TTS) é atualmente uma tecnologia madura usada em muitas áreas como a educação e a acessibilidade. Alguns módulos destes sistemas dependem de conhecimento prévio da linguagem alvo, e enquanto existe muitos recursos públicos para algumas línguas (por exemplo: Inglês e Japonês), os recursos para o Português do Brasil (PB) ainda são muito limitados. Assim, este trabalho descreve o desenvolvimento de um sistema TTS completo baseado em modelos ocultos de Markov (HMM) utilizando o toolkit HTS (HMM Text to Speech toolkit) para PB, o qual pode ser aplicado ao ambiente desktop e embarcado, incluindo os scripts de treinamento com uma interface gráfica, uma base de dados de treinamento para demonstração, e uma interface de programação para aplicações com o motor de síntese HTS_engine. Também foi incluído nos scripts de treinamento um grande conjunto de ferramentas de processamento de linguagem natural (NLP), dentre elas um módulo específico e inédito de rotulação de texto para gerar entradas para o HTS_engine, o que expande de forma considerável os recursos publicamente disponíveis para o PB em relação aos sistemas TTS baseados em HMM, permitindo novas pesquisas acadêmicas e aplicações pela indústria. Todas estas ferramentas juntas foram chamadas de UFPAT2S Framework. Para validar o desempenho do UFPAT2S foram desenvolvidos testes que permitem comparar o sistema proposto com outros sistemas disponíveis no mercado através de avaliações subjetivas e objetivas com ouvintes voluntários.