IMITACAO DA VOZ HUMANA ATRAVES DO PROCESSO DE ANALISE-POR-SINTESE UTILIZANDO ALGORITMO GENETICO E SINTETIZADOR DE VOZ POR FORMANTES
Síntese de voz, Algoritmo genético, Utterance copy
Utterance copy consiste em estimar os parâmetros de entrada de um sintetizador para gerar um sinal de voz utilizando um sintetizador de voz. Este processo distingue-se da tradicional conversão texto-fala porém é usado em muitas áreas, especialmente em linguística e saúde. Imitar a voz humana através do mecanismo de utterance copy é um problema inverso difícil pois este mapeamento é não linear e de muitos para um. Por exemplo, existem diferentes combinações dos parâmetros de entrada do sintetizador que produzem o mesmo sinal de voz sintética. Sendo assim, realizar manualmente a imitação da voz requer uma quantidade considerável de tempo e métodos automáticos como o propsosto aqui, são de interesse. Este trabalho apresenta um framework baseado em algoritmo genético (AG) para estimar automaticamente os parâmetros de entrada de um sinteitzador por formantes, utilizando o processo de análise-por-síntese. Os resultados apresentados compreendem a imitaçãode vozes sintéticas (geradas por computador) e naturais (geradas por humanos), para os falantes masculinos e femininos. Estes resultados são comparados com os obtidos através do Winsnoori (baseline), o único software disponível atualmente que executa a mesma tarefa. Os experimentos mostraram que o framework desenvolvido (newGASpeech) é uma alternativa eficaz para o trabalhoso processo manual de estimar os parâmetros de entrada de um sintetizador por formantes, superando a qualidade das vozes geradas pelo baseline em relação à cinco métricas objetivas utilizadas e ao teste subjetivo aplicado em vinte e sete ouvintes.