Criterios de etiquetación y desambiguación morfosintáctica de corpus en español

  1. CIVIT TORRUELLA, MONTSERRAT
Supervised by:
  1. María Antonia Martí Antonín Director

Defence university: Universitat de Barcelona

Fecha de defensa: 04 July 2003

Committee:
  1. Guillermo Rojo Sánchez Chair
  2. Itziar Aduriz Secretary
  3. Horacio Rodríguez Hontoria Committee member
  4. Santiago Alcoba Committee member
  5. Lluís Padró Cirera Committee member

Type: Thesis

Teseo: 93150 DIALNET

Abstract

El trabajo de investigación realilzado se enmarca en el área de procesamiento automático de corpus en español. Las aportaciones atañen tanto a la mejora de recursos existentes como el desarrollo de nuevas estructuras de datos y la definición de parámetros para el desarrollo de nuevos recursos: redefinición del etisquetario previo del analizador morfológico y la introducción de conocimiento lingüístico en un sistema de desambiguación automática, la creación del corpus CLIC-TALP, definiendo los criterios para la desambiguación morfológica manual: desarrollo de una gramática de amplia cobertura para el análisis parcial de textos en español; y, por último el establecimiento de los criterios para la anotación sintáctica manual del corpus cast3LB. Con este trabajo se cierra el procesamiento automático de textos inestrictos en español desde el análisis morfológico hasta la sintaxis superficial.