Análisis morfosintáctico y clasificación de entidades nombradas en un entorno Big Data

  1. Pablo Gamallo
  2. Juan Carlos Pichel
  3. Marcos García
  4. José Manuel Abuín
  5. Tomás Fernández-Pena
Procesamiento del lenguaje natural

ISSN: 1135-5948

Ano de publicación: 2014

Número: 53

Páxinas: 17-24

Tipo: Artigo

Outras publicacións en: Procesamiento del lenguaje natural

Obxectivos de Desenvolvemento Sustentable


Este artículo describe una suite de módulos lingüísticos para el castellano, basado en una arquitectura en tuberías, que incluye tareas de análisis morfosintáctico así como de reconocimiento y clasificación de entidades nombradas. Se han aplicado técnicas de paralelización en un entorno Big Data para conseguir que la suite de módulos sea más eficiente y escalable y, de este modo, reducir de forma significativa los tiempos de cómputo con los que poder abordar problemas a la escala de la Web. Los módulos han sido desarrollados con técnicas básicas para facilitar su integración en entornos distribuidos, con un rendimiento próximo al estado del arte.

