Criterios de etiquetación y desambiguación morfosintáctica de corpus en español

  1. CIVIT TORRUELLA, MONTSERRAT
Dirigida por:
  1. María Antonia Martí Antonín Director/a

Universidad de defensa: Universitat de Barcelona

Fecha de defensa: 04 de julio de 2003

Tribunal:
  1. Guillermo Rojo Sánchez Presidente
  2. Itziar Aduriz Secretario/a
  3. Horacio Rodríguez Hontoria Vocal
  4. Santiago Alcoba Vocal
  5. Lluís Padró Cirera Vocal

Tipo: Tesis

Teseo: 93150 DIALNET

Resumen

El trabajo de investigación realilzado se enmarca en el área de procesamiento automático de corpus en español. Las aportaciones atañen tanto a la mejora de recursos existentes como el desarrollo de nuevas estructuras de datos y la definición de parámetros para el desarrollo de nuevos recursos: redefinición del etisquetario previo del analizador morfológico y la introducción de conocimiento lingüístico en un sistema de desambiguación automática, la creación del corpus CLIC-TALP, definiendo los criterios para la desambiguación morfológica manual: desarrollo de una gramática de amplia cobertura para el análisis parcial de textos en español; y, por último el establecimiento de los criterios para la anotación sintáctica manual del corpus cast3LB. Con este trabajo se cierra el procesamiento automático de textos inestrictos en español desde el análisis morfológico hasta la sintaxis superficial.