Criterios de etiquetación y desambiguación morfosintáctica de corpus en español

  1. CIVIT TORRUELLA, MONTSERRAT
Dirixida por:
  1. María Antonia Martí Antonín Director

Universidade de defensa: Universitat de Barcelona

Fecha de defensa: 04 de xullo de 2003

Tribunal:
  1. Guillermo Rojo Sánchez Presidente
  2. Itziar Aduriz Secretario/a
  3. Horacio Rodríguez Hontoria Vogal
  4. Santiago Alcoba Vogal
  5. Lluís Padró Cirera Vogal

Tipo: Tese

Teseo: 93150 DIALNET

Resumo

El trabajo de investigación realilzado se enmarca en el área de procesamiento automático de corpus en español. Las aportaciones atañen tanto a la mejora de recursos existentes como el desarrollo de nuevas estructuras de datos y la definición de parámetros para el desarrollo de nuevos recursos: redefinición del etisquetario previo del analizador morfológico y la introducción de conocimiento lingüístico en un sistema de desambiguación automática, la creación del corpus CLIC-TALP, definiendo los criterios para la desambiguación morfológica manual: desarrollo de una gramática de amplia cobertura para el análisis parcial de textos en español; y, por último el establecimiento de los criterios para la anotación sintáctica manual del corpus cast3LB. Con este trabajo se cierra el procesamiento automático de textos inestrictos en español desde el análisis morfológico hasta la sintaxis superficial.