Conversión Fonética Automática con Información Fonológica para el Gallego

  1. García González, Marcos
  2. González López, Isaac
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Ano de publicación: 2011

Número: 47

Páxinas: 283-291

Tipo: Artigo

Outras publicacións en: Procesamiento del lenguaje natural

Resumo

En este artículo se presenta un sistema de conversión fonética con información fonológica para el gallego. El conversor permite evaluar diferentes procesos fonológicos como la silabificación o la derivación fonológica, así como transcribir automáticamente léxicos con información fonética de diferentes variedades lingüísticas. Varios módulos componen el sistema presentado: (i) conversión fonológica, que genera una representación fonológica a partir de un input ortográfico; (ii) silabificación, (iii) asignación de acento y (iv) conversión fonética, que produce diferentes representaciones fonéticas (de diversos dialectos) desde una representación fonológica. La precisión del sistema, evaluado en un corpus periodístico, supera el 99 %.

Referencias bibliográficas

  • Blevins, J. 1995. The Syllable in Phonological Theory. En J. A. Goldsmith, editor, The Handbook of Phonological Theory. Blackwell Publishers, Cambridge, MA, páginas 206–244.
  • Braga, Daniela y Luís Coelho. 2006. Lettertosound conversion for galician TTS systems. En Actas de las IV Jornadas en Tecnologia del Habla, páginas 171–176, Zaragoza.
  • Braga, Daniela, Luís Coelho, y F. Resende Jr. 2006. A Rule-Based Graphemeto-Phone Converter for TTS Systems in European Portuguese. En Proceedings of the VI International Telecommunications Symposium (ITS’06), Fortaleza.
  • Braga, Daniela y Xosé Ramón Freixeiro. 2007. Algoritmos de Conversão Grafema-Fone em Galego para Sistemas de Conversão Texto-Fala. En Burghard Baltrusch y Gabriel Pérez Durán, editores, Estudosgalegos de Tradución & Paratradución no século XXI, Vigo. Xerais.
  • Campillo, Francisco, Daniela Braga, Ana B. Mourín, Carmen García-Mateo, Pedro Silva, Miguel Sales Dias, y Francisco Méndez. 2010. Building High Quality Databases for Minority Languages such as Galician. En Proceedings of the 7th conference on International Language Resources and Evaluation (LREC’10), Valletta.
  • Carreras, Xavier, Isaac Chao, Lluís Padró, y Muntsa Padró. 2004. FreeLing: An Open-Source Suite of Language Analyzers. En Proceedings of the 4th International Conference on Language Resources and Evaluation (LREC’04), Lisboa.
  • Chomsky, Noam y Morris Halle. 1968. The Sound Pattern of English. Harper and Row, New York.
  • Garcia, Marcos y Pablo Gamallo. 2010. Análise Morfossintáctica para Português Europeu e Galego: Problemas, Soluções e Avaliação. Linguamática. Revista para o Processamento Automático das Línguas Ibéricas, 2(2):59–67.
  • González González, Manuel, Eduardo Rodríguez Banga, Francisco Campillo, Francisco Méndez, Leandro Rodríguez Liñares, y Gonzalo Iglesias. 2008. Specific features of the Galician language and implications for speech technology development. Speech Communication, 50:874–887.
  • Ladefoged, Peter. 1990. The Revised International Phonetic Alphabet. Language, 66(3):550–552.
  • Malvar, Paulo, José Ramom Pichel, Óscar Senra, Pablo Gamallo, y Alberto García. 2010. Vencendo a escassez de recursos computacionais. Carvalho: Tradutor automático estatístico inglês-galego a partir do corpus paralelo Europarl Inglês- Português. Linguamática. Revista para o Processamento Automático das Línguas Ibéricas, 2(2):31–38.
  • Mateus, Maria Helena Mira y Ernesto d’ Andrade. 2000. The Phonology of Portuguese. Oxford University Press, Oxford.
  • Mohanan, Karuvannur P. 1986. The Theory of Lexical Phonology. Reidel, Dordrecht.
  • Mourín, Ana, Daniela Braga, Luís Coelho, Carmen García-Mateo, Francisco Campillo, y Miguel Dias. 2009. Homograph Disambiguation in Galician TTS Systems. En IX Congreso Internacional da Asociación Internacional de Estudos Galegos, A Coruña - Santiago de Compostela - Vigo.
  • Oliveira, Catarina, Lurdes Castro Moutinho, y António J. S. Teixeira. 2005. On european Portuguese automatic syllabification. En Proceedings of Interspeech 2005, páginas 2933–2936.
  • Paulo, Sérgio, Luís C. Oliveira, Carlos Mendes, Luís Figueira, Renato Cassaca, Céu Viana, y Helena Moniz. 2008. DIXI — A Generic Text-to-Speech System for European Portuguese. En Proceedings of the 8th international conference on Computational Processing of the Portuguese Language (PROPOR’08), páginas 91–100.
  • Regueira, Xosé Luís. 2010. Dicionario de Pronuncia da Lingua Galega. Real Academia Galega e Instituto da Lingua Galega, A Coruña.
  • Seara, Izabel C., Fernando S. Pacheco, Rui Seara Júnior, Sandra G. Kafka, Simone Klein, y Rui Seara. 2003. Geração Automática de Variantes de Léxicos do Português Brasileiro para Sistemas de Reconhecimento de Fala. En Actas do XX Simpósio Brasileiro de Telecomunicações, Rio de Janeiro.
  • Selkirk, E. O. 1984. On the major class features and syllable theory. En M. Aronoff y R. T. Oehrle, editores, Language Sound Structure. The MIT Press, Cambridge, MA, páginas 107–136.
  • Siravenha, Ana C., Nelson Neto, Valquiria Macedo, y Aldebaro Klautau. 2008. Uso de Regras Fonológicas com Determinação de Vogal Tônica para Conversão Grafema-Fone em Português Brasileiro. En Proceedings of the 7th International Information and Telecommunication Technologies Symposium (I2TS’08), Foz do Iguaçu.
  • Teixeira, António J. S., Catarina Oliveira, y Lurdes Castro Moutinho. 2006. On the Use of Machine Learning and Syllable Information in European Portuguese Grapheme-Phone Conversion. En Proceedings of the 7th International Conference on Computational Processing of Portuguese Language., páginas 212–215.
  • Vigário, Marina, Fernando Martins, y Sónia Frota. 2006. A ferramenta FreP e a frequência de tipos silábicos e classes de segmentos no Português. En Selecção de Comunicações apresentadas no XX Encontro Nacional da Associação Portuguesa de Linguística, páginas 675–687.