Sistema de conversión texto-voz en lengua gallega basado en la selección combinada de unidades acústicas y prosódicas

  1. Méndez Pazó, Francisco
  2. Fernández Rei, Elisa
  3. Rodríguez Banga, Eduardo
  4. Campillo Díaz, Francisco
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Ano de publicación: 2002

Título do exemplar: XVII Congreso de la SEPLN. Universidad de Valladolid, 11-13 septiembre 2002

Número: 29

Páxinas: 153-158

Tipo: Artigo

Outras publicacións en: Procesamiento del lenguaje natural

Resumo

En esta comunicación se describe un sistema de conversión texto-voz en lengua gallega basado en las denominadas "técnicas de síntesis basadas en corpus". A diferencia de los tradicionales sintetizadores de voz por concatenación, que normalmente utilizan un conjunto de unidades de síntesis reducido, los sistemas de síntesis basados en corpus consideran múltiples realizaciones de cada unidad y, mediante técnicas de programación dinámica, seleccionan aquella secuencia de unidades que minimiza una función de coste. Por otro lado, tradicionalmente, la generación de la información prosódica se realiza en una etapa previa a la selección de unidades, lo que ocasiona que en muchas ocasiones sea necesario manipular en exceso las unidades seleccionadas con el fin de ajustarlas a la entonación, duración y energía deseadas. En este artículo también se propone la selección conjunta del contorno entonativo y de las unidades de síntesis, con objeto de minimizar la distorsión causada por las modificaciones prosódicas.