Alineamiento y validación de terminologías a gran escala en el ámbito médico

  1. Lalín Rodríguez, María del Rosario
Dirigida por:
  1. Diego Martínez Hernández Director
  2. María Jesús Taboada Iglesias Directora

Universidad de defensa: Universidade de Santiago de Compostela

Fecha de defensa: 20 de enero de 2012

Tribunal:
  1. Asunción Gómez Pérez Presidente/a
  2. Eva Cernadas García Secretaria
  3. Rafael Martínez Tomás Vocal
  4. Ana Esperanza Delgado García Vocal
  5. Antonio Fernández Caballero Vocal
Departamento:
  1. Departamento de Física Aplicada

Tipo: Tesis

Resumen

El trabajo contenido en esta tesis se centra en el desarrollo de un método automático para el alineamiento de terminologías de gran tamaño. Aunque ha habido grandes avances en esta materia, la presencia de expertos seguía siendo necesaria para la validación de los alineamientos. Así, en esta tesis doctoral, hemos presentado un método semiautomático para la equiparación de terminologías de gran tamaño y la validación y desambiguación de los alineamientos resultantes. El método incluye la combinación de diferentes técnicas (léxicas, estructurales y de procesamiento de lenguaje natural), con el fin de incrementar la automatización del proceso, a la vez que la precisión global. La arquitectura está basada en los recursos disponibles en el momento, tales como las técnicas de equiparación léxicas proporcionadas por el servidor de conocimiento del UMLS o técnicas de procesamiento de lenguaje natural. Con ello, se obtiene un alineamiento léxico inicial entre las terminologías. A continuación, esta tesis proporciona un procedimiento automático de validación de los resultados alcanzados, que permite conocer el nivel de similitud semántica que presentan los alineamientos resultantes, seleccionando los más adecuados. Para ello, usa información semántica presente en las terminologías y parámetros calculables automáticamente como son la similitud de las categorías de alto nivel y los factores de similitud de los conceptos de cada alineamiento. Por último, se usan técnicas de procesamiento de lenguaje natural para obtener alienamientos parciales para conceptos sin alineamiento directo.