Improvements to the performance and applicability of dependency parsing

  1. Fernández-González, Daniel
unter der Leitung von:
  1. Manuel Vilares Ferro Doktorvater/Doktormutter
  2. Carlos Gómez Rodríguez Doktorvater/Doktormutter

Universität der Verteidigung: Universidade da Coruña

Fecha de defensa: 03 von November von 2015

Gericht:
  1. Giorgio Satta Präsident/in
  2. Miguel Á. Alonso Sekretär/in
  3. Arantza Díaz de Ilarraza Sánchez Vocal
  4. Pablo Gamallo Otero Vocal
  5. Jesús Vilares Vocal

Art: Dissertation

Teseo: 394866 DIALNET lock_openRUC editor

Zusammenfassung

Los analizadores de dependencias han generado un gran interés en las últimas décadas debido a su utilidad en un amplio rango de tareas de procesamiento de lenguaje natural. Estos utilizan grafos de dependencias para definir la estructura sintáctica de una oración dada. En particular, los algoritmos basados en transiciones proveen un análisis sintáctico de dependencias eficiente y preciso. Sin embargo, su principal inconveniente es que tienden a sufrir propagación de errores. Así, una decisión temprana tomada erróneamente podría posicionar el analizador en un estado incorrecto, causando más errores en futuras decisiones. Esta tesis se centra en mejorar la precisión de los analizadores basados en transiciones mediante la reducción del efecto de la propagación de errores, mientras mantienen su velocidad y eficiencia. Concretamente, proponemos cinco enfoques diferentes que han demostrado ser beneficiosos para su rendimiento, al aliviar la propagación de errores e incrementar su precisión. Además, hemos ampliado la utilidad de los analizadores de dependencias más allá de la construcción de grafos de dependencias. Presentamos una novedosa técnica que permite que estos sean capaces de construir representaciones de constituyentes. Esto cubriría la necesidad de la comunidad de procesamiento de lenguaje natural de disponer de un analizador eficiente capaz de proveer un árbol de constituyentes para representar la estructura sintáctica de las oraciones.