Contextualizing a data warehouse with documents

  1. Pérez Martínez, Juan Manuel
unter der Leitung von:
  1. Rafael Berlanga Doktorvater/Doktormutter
  2. María José Aramburu Cabo Doktorvater/Doktormutter

Universität der Verteidigung: Universitat Jaume I

Fecha de defensa: 26 von Februar von 2007

Gericht:
  1. Torben Bach Pedersen Präsident/in
  2. Michael Gould Sekretär/in
  3. José Samos Jiménez Vocal
  4. Juan Trujillo Mondéjar Vocal
  5. David Enrique Losada Carril Vocal

Art: Dissertation

Teseo: 138878 DIALNET lock_openTDX editor

Zusammenfassung

La tecnología actual de los almacenes de datos y las técnicas OLAP permite a las organizaciones analizar los datos estructurados que éstas recopilan en sus bases de datos, Las circunstancias que rodean a estos datos aparecen descritas en documentos, típicamente ricos en texto. Actualmente es posible encontrar muchos de estos documentos en formato XML. El objetivo de la tesis es proporcionar un marco formal para integrar un almacén de datos tradicional con un almacén de documentos XML y analizar los datos junto a su contexto. Llamamos al sistema resultante almacén contextualizado. En este nuevo tipo de almacén, el usuario especificará un contexto de análisis proporcionando una secuencia de palabras clave. El análisis se realizará en un nuevo tipo de cubo multidimensional, denominado R-cubo. Cada hecho de un R-cubo tendrá asociado el conjunto de documentos que describen su contexto. Asignaremos a cada hecho un valor numérico que representará su relevancia con respecto al contexto de análisis. Esta tesis propone un nuevo modelo de recuperación para medir la relevancia de los hechos. Asimismo, se definen formalmente los R-cubos, proporcionando su modelo de datos y álgebra.