Resumen lingüístico de series de datos mediante técnicas de soft computinguna aplicación a los cubos olap con dimensión tiempo
- Castillo Ortega, Rita María
- Nicolás Marín Ruiz Director
- Daniel Sánchez Fernández Co-director
Defence university: Universidad de Granada
Fecha de defensa: 25 September 2012
- María Amparo Vila Miranda Chair
- Olga Pons Capote Secretary
- Gracián Triviño Barros Committee member
- Guy De Tré Committee member
- Alberto José Bugarín Diz Committee member
Type: Thesis
Abstract
En una sociedad en la que se consumen y producen infinidad de datos, es importante ser capaces de transformas dichos datos en información. En concreto en el ámbito del Business Intelligence la información será destinada a la toma de decisiones en las compañías. En esta tesis se presenta un modelo general y configurable que permita al usuario obtener información legible utilizando lenguaje natural y que describa grandes conjuntos de datos numéricos. Junto con este se presenta también un modelo multidimensional que permita al usuario medir la calidad de los resultados. Asimismo se presentan diferentes enfoques a la hora de implementar la propuesta para que ésta no se quede en un simple modelo teórico y pueda ser utilizada verdaderamente por los usuarios. Como el nuestro es un modelo general, puede ser particularizado para describir diferentes conjuntos de datos, desde series de tiempo (utilizada como caso base) como la comparación de series de tiempo, u otros tipos de conjuntos de datos, por ejemplo las imágenes. En la tesis se presentan algunos de los campos en los que el modelo es aplicable. Finalmente se ha implementado una herramienta web que permita al usuario sin conocimiento experto el manejo de cubos de datos multidimensionales de los que de forma sencilla podrá obtener series de tiempo que posteriormente tendrá oportunidad de describir lingüísticamente. En general, abordamos un problema de creación de lenguaje natural de forma automática para describir conjuntos de datos numéricos, en especial series de datos temporales. Las técnicas de Natural Language Generation y Soft Computing son ampliamente usadas en esta tarea.