Alineamiento y validación de terminologías a gran escala en el ámbito médico

  1. Lalín Rodríguez, María del Rosario
unter der Leitung von:
  1. Diego Martínez Hernández Doktorvater
  2. María Jesús Taboada Iglesias Doktormutter

Universität der Verteidigung: Universidade de Santiago de Compostela

Fecha de defensa: 20 von Januar von 2012

Gericht:
  1. Asunción Gómez Pérez Präsident/in
  2. Eva Cernadas García Sekretärin
  3. Rafael Martínez Tomás Vocal
  4. Ana Esperanza Delgado García Vocal
  5. Antonio Fernández Caballero Vocal
Fachbereiche:
  1. Departamento de Física Aplicada

Art: Dissertation

Zusammenfassung

El trabajo contenido en esta tesis se centra en el desarrollo de un método automático para el alineamiento de terminologías de gran tamaño. Aunque ha habido grandes avances en esta materia, la presencia de expertos seguía siendo necesaria para la validación de los alineamientos. Así, en esta tesis doctoral, hemos presentado un método semiautomático para la equiparación de terminologías de gran tamaño y la validación y desambiguación de los alineamientos resultantes. El método incluye la combinación de diferentes técnicas (léxicas, estructurales y de procesamiento de lenguaje natural), con el fin de incrementar la automatización del proceso, a la vez que la precisión global. La arquitectura está basada en los recursos disponibles en el momento, tales como las técnicas de equiparación léxicas proporcionadas por el servidor de conocimiento del UMLS o técnicas de procesamiento de lenguaje natural. Con ello, se obtiene un alineamiento léxico inicial entre las terminologías. A continuación, esta tesis proporciona un procedimiento automático de validación de los resultados alcanzados, que permite conocer el nivel de similitud semántica que presentan los alineamientos resultantes, seleccionando los más adecuados. Para ello, usa información semántica presente en las terminologías y parámetros calculables automáticamente como son la similitud de las categorías de alto nivel y los factores de similitud de los conceptos de cada alineamiento. Por último, se usan técnicas de procesamiento de lenguaje natural para obtener alienamientos parciales para conceptos sin alineamiento directo.