Resumen lingüístico de series de datos mediante técnicas de soft computinguna aplicación a los cubos olap con dimensión tiempo

  1. Castillo Ortega, Rita María
Dirixida por:
  1. Nicolás Marín Ruiz Director
  2. Daniel Sánchez Fernández Co-director

Universidade de defensa: Universidad de Granada

Fecha de defensa: 25 de setembro de 2012

Tribunal:
  1. María Amparo Vila Miranda Presidente/a
  2. Olga Pons Capote Secretario/a
  3. Gracián Triviño Barros Vogal
  4. Guy De Tré Vogal
  5. Alberto José Bugarín Diz Vogal

Tipo: Tese

Resumo

En una sociedad en la que se consumen y producen infinidad de datos, es importante ser capaces de transformas dichos datos en información. En concreto en el ámbito del Business Intelligence la información será destinada a la toma de decisiones en las compañías. En esta tesis se presenta un modelo general y configurable que permita al usuario obtener información legible utilizando lenguaje natural y que describa grandes conjuntos de datos numéricos. Junto con este se presenta también un modelo multidimensional que permita al usuario medir la calidad de los resultados. Asimismo se presentan diferentes enfoques a la hora de implementar la propuesta para que ésta no se quede en un simple modelo teórico y pueda ser utilizada verdaderamente por los usuarios. Como el nuestro es un modelo general, puede ser particularizado para describir diferentes conjuntos de datos, desde series de tiempo (utilizada como caso base) como la comparación de series de tiempo, u otros tipos de conjuntos de datos, por ejemplo las imágenes. En la tesis se presentan algunos de los campos en los que el modelo es aplicable. Finalmente se ha implementado una herramienta web que permita al usuario sin conocimiento experto el manejo de cubos de datos multidimensionales de los que de forma sencilla podrá obtener series de tiempo que posteriormente tendrá oportunidad de describir lingüísticamente. En general, abordamos un problema de creación de lenguaje natural de forma automática para describir conjuntos de datos numéricos, en especial series de datos temporales. Las técnicas de Natural Language Generation y Soft Computing son ampliamente usadas en esta tarea.