Alineamiento y validación de terminologías a gran escala en el ámbito médico

  1. Lalín Rodríguez, María del Rosario
Supervised by:
  1. Diego Martínez Hernández Director
  2. María Jesús Taboada Iglesias Director

Defence university: Universidade de Santiago de Compostela

Fecha de defensa: 20 January 2012

Committee:
  1. Asunción Gómez Pérez Chair
  2. Eva Cernadas García Secretary
  3. Rafael Martínez Tomás Committee member
  4. Ana Esperanza Delgado García Committee member
  5. Antonio Fernández Caballero Committee member
Department:
  1. Department of Applied Physics

Type: Thesis

Abstract

El trabajo contenido en esta tesis se centra en el desarrollo de un método automático para el alineamiento de terminologías de gran tamaño. Aunque ha habido grandes avances en esta materia, la presencia de expertos seguía siendo necesaria para la validación de los alineamientos. Así, en esta tesis doctoral, hemos presentado un método semiautomático para la equiparación de terminologías de gran tamaño y la validación y desambiguación de los alineamientos resultantes. El método incluye la combinación de diferentes técnicas (léxicas, estructurales y de procesamiento de lenguaje natural), con el fin de incrementar la automatización del proceso, a la vez que la precisión global. La arquitectura está basada en los recursos disponibles en el momento, tales como las técnicas de equiparación léxicas proporcionadas por el servidor de conocimiento del UMLS o técnicas de procesamiento de lenguaje natural. Con ello, se obtiene un alineamiento léxico inicial entre las terminologías. A continuación, esta tesis proporciona un procedimiento automático de validación de los resultados alcanzados, que permite conocer el nivel de similitud semántica que presentan los alineamientos resultantes, seleccionando los más adecuados. Para ello, usa información semántica presente en las terminologías y parámetros calculables automáticamente como son la similitud de las categorías de alto nivel y los factores de similitud de los conceptos de cada alineamiento. Por último, se usan técnicas de procesamiento de lenguaje natural para obtener alienamientos parciales para conceptos sin alineamiento directo.