Resumen lingüístico de series de datos mediante técnicas de soft computinguna aplicación a los cubos olap con dimensión tiempo

  1. Castillo Ortega, Rita María
unter der Leitung von:
  1. Nicolás Marín Ruiz Doktorvater/Doktormutter
  2. Daniel Sánchez Fernández Co-Doktorvater/Doktormutter

Universität der Verteidigung: Universidad de Granada

Fecha de defensa: 25 von September von 2012

Gericht:
  1. María Amparo Vila Miranda Präsident/in
  2. Olga Pons Capote Sekretär/in
  3. Gracián Triviño Barros Vocal
  4. Guy De Tré Vocal
  5. Alberto José Bugarín Diz Vocal

Art: Dissertation

Zusammenfassung

En una sociedad en la que se consumen y producen infinidad de datos, es importante ser capaces de transformas dichos datos en información. En concreto en el ámbito del Business Intelligence la información será destinada a la toma de decisiones en las compañías. En esta tesis se presenta un modelo general y configurable que permita al usuario obtener información legible utilizando lenguaje natural y que describa grandes conjuntos de datos numéricos. Junto con este se presenta también un modelo multidimensional que permita al usuario medir la calidad de los resultados. Asimismo se presentan diferentes enfoques a la hora de implementar la propuesta para que ésta no se quede en un simple modelo teórico y pueda ser utilizada verdaderamente por los usuarios. Como el nuestro es un modelo general, puede ser particularizado para describir diferentes conjuntos de datos, desde series de tiempo (utilizada como caso base) como la comparación de series de tiempo, u otros tipos de conjuntos de datos, por ejemplo las imágenes. En la tesis se presentan algunos de los campos en los que el modelo es aplicable. Finalmente se ha implementado una herramienta web que permita al usuario sin conocimiento experto el manejo de cubos de datos multidimensionales de los que de forma sencilla podrá obtener series de tiempo que posteriormente tendrá oportunidad de describir lingüísticamente. En general, abordamos un problema de creación de lenguaje natural de forma automática para describir conjuntos de datos numéricos, en especial series de datos temporales. Las técnicas de Natural Language Generation y Soft Computing son ampliamente usadas en esta tarea.