Alineamiento y validación de terminologías a gran escala en el ámbito médico
- Lalín Rodríguez, María del Rosario
- Diego Martínez Hernández Director
- María Jesús Taboada Iglesias Director
Universidade de defensa: Universidade de Santiago de Compostela
Fecha de defensa: 20 de xaneiro de 2012
- Asunción Gómez Pérez Presidente/a
- Eva Cernadas García Secretaria
- Rafael Martínez Tomás Vogal
- Ana Esperanza Delgado García Vogal
- Antonio Fernández Caballero Vogal
Tipo: Tese
Resumo
El trabajo contenido en esta tesis se centra en el desarrollo de un método automático para el alineamiento de terminologías de gran tamaño. Aunque ha habido grandes avances en esta materia, la presencia de expertos seguía siendo necesaria para la validación de los alineamientos. Así, en esta tesis doctoral, hemos presentado un método semiautomático para la equiparación de terminologías de gran tamaño y la validación y desambiguación de los alineamientos resultantes. El método incluye la combinación de diferentes técnicas (léxicas, estructurales y de procesamiento de lenguaje natural), con el fin de incrementar la automatización del proceso, a la vez que la precisión global. La arquitectura está basada en los recursos disponibles en el momento, tales como las técnicas de equiparación léxicas proporcionadas por el servidor de conocimiento del UMLS o técnicas de procesamiento de lenguaje natural. Con ello, se obtiene un alineamiento léxico inicial entre las terminologías. A continuación, esta tesis proporciona un procedimiento automático de validación de los resultados alcanzados, que permite conocer el nivel de similitud semántica que presentan los alineamientos resultantes, seleccionando los más adecuados. Para ello, usa información semántica presente en las terminologías y parámetros calculables automáticamente como son la similitud de las categorías de alto nivel y los factores de similitud de los conceptos de cada alineamiento. Por último, se usan técnicas de procesamiento de lenguaje natural para obtener alienamientos parciales para conceptos sin alineamiento directo.