Criterios de etiquetación y desambiguación morfosintáctica de corpus en español
- CIVIT TORRUELLA, MONTSERRAT
- María Antonia Martí Antonín Director
Universidade de defensa: Universitat de Barcelona
Fecha de defensa: 04 de xullo de 2003
- Guillermo Rojo Sánchez Presidente
- Itziar Aduriz Secretario/a
- Horacio Rodríguez Hontoria Vogal
- Santiago Alcoba Vogal
- Lluís Padró Cirera Vogal
Tipo: Tese
Resumo
El trabajo de investigación realilzado se enmarca en el área de procesamiento automático de corpus en español. Las aportaciones atañen tanto a la mejora de recursos existentes como el desarrollo de nuevas estructuras de datos y la definición de parámetros para el desarrollo de nuevos recursos: redefinición del etisquetario previo del analizador morfológico y la introducción de conocimiento lingüístico en un sistema de desambiguación automática, la creación del corpus CLIC-TALP, definiendo los criterios para la desambiguación morfológica manual: desarrollo de una gramática de amplia cobertura para el análisis parcial de textos en español; y, por último el establecimiento de los criterios para la anotación sintáctica manual del corpus cast3LB. Con este trabajo se cierra el procesamiento automático de textos inestrictos en español desde el análisis morfológico hasta la sintaxis superficial.