Análisis estadístico de datos espacio-temporales mediante modelos funcionales de series temporales

  1. Salmerón Gómez, Román
Dirixida por:
  1. María Dolores Ruiz Medina Director

Universidade de defensa: Universidad de Granada

Fecha de defensa: 15 de xullo de 2008

Tribunal:
  1. Ramón Gutiérrez Jáimez Presidente/a
  2. Andrés González Carmona Secretario/a
  3. Antonio Pascual Acosta Vogal
  4. Wenceslao González Manteiga Vogal
  5. Rafael Herrerías Pleguezuelo Vogal

Tipo: Tese

Resumo

ANTECEDENTES DEL TEMA En las últimas décadas se ha producido un desarrollo importante de la Estadística Espacio-Temporal, dada la necesidad de analizar la evolución temporal del comportamiento espacial de magnitudes aleatorias que son de interés en estudios desarrollados en diversas áreas aplicadas tales como Medio-Ambiente, Geofísica, Biología y Medicina, En particular, en el contexto geoestadístico, se ha producido un avance importante en la derivación de modelos flexibles para el procesamiento y análisis estadístico de datos espacio-temporales. Los enfoques adoptados se fundamentan esencialmente en la Estadística Espacial, dado su auge previo en este contexto. La mayor parte de los modelos se introducen inicialmente bajo la hipótesis de estacionariedad en el tiempo. Posteriormente, se amplia la clase de modelos al caso no estacionario. Uno de los objetivos primordiales en el diseño de modelos geoestadísticos espacio-temporales es la representación de los diferentes niveles de interacción espacio-temporal que caracterizan la estructura de dependencia de magnitudes definidas en el espacio y tiempo. En este sentido, se ha desarrollado una extensa literatura dedicada a la introducción de modelos de covarianza espacio-temporales separables y no separables, en el caso de modelos definidos en tiempo y espacios continuos, así como a la formulación de funciones y núcleos de autocorrelación, en el caso de modelos definidos en tiempo discreto y espacio continuos . En esta memoria se analizarán diferentes modelos de interacción espacio-temporal desde la perspectiva funcional, es decir, considerando diferentes familias de operadores de autocorrelación, caracterizados en términos de sus propiedades espectrales puntuales. Por otra parte, dado el avance de las nuevas tecnologías, que ha permitido el diseño de sofisticados dispositivos para la medición y procesamiento de información, se ha incrementado el número de situaciones donde se dispone de información muestral funcional. Este hecho se ha reflejado en un importante avance, relativamente reciente, de la Estadística Funcional. De hecho, en la última década, se ha desarrollado una extensa literatura en relación con el diseño de métodos de estimación y contraste a partir de datos funcionales. En particular, un enfoque apropiado para la derivación de modelos flexibles para el análisis de secuencias de datos funcionales es la teoría de series temporales funcionales, introducida en el contexto de procesos Banach y Hilbert-valuados. En este ámbito, existen resultados recientes sobre estimación paramérica funcional, así como sobre extrapolación y filtrado. Las dificultades surgidas en el desarrollo de la Inferencia Funcional residen en la elevada dimensión de los problemas que se plantean. Por tanto, con frecuencia, se han de aplicar transformaciones ortogonales o biortogonales para la adecuada codificación de información. Las transformaciones usuales codifican la información en el dominio espectral discreto. Este es el caso de las transformaciones implicadas en las descomposiciones Empirical Orthogonal Function (EOF), Principal Oscillation Pattern (POP) y Functional Principal Component (FPC). Alternativamente, se puede utilizar el dominio de la transformada wavelet que proporciona una codificación localizada a diferentes niveles de resolución. La transformada wavelet ha sido utilizada en el contexto funcional esencialmente en el análisis de secuencias de imágenes, especialmente en Medicina. En relación con las transformaciones discretas asociadas a la teoría espectral de operadores, en el contexto funcional, el análisis de componentes principales funcional (FPCA) es una de las herramientas más utilizadas en el procesamiento de información muestral funcional. Sin embargo, en el caso de secuencias de datos funcionales generadas mediante modelos ARH(p), p >0, dicho análisis no proporciona una versión diagonal de la ecuación de estados funcional, lo que dificulta la implementación de algoritmos de estimación en este contexto. Este hecho motivó el inicio del trabajo desarrollado en la presente memoria, donde se obtienen versiones escalares de las ecuaciones de estados funcionales que definen los modelos ARH(1) y ARH(p), p>0, que permiten la implementación del filtrado de Kalman y el algoritmo EM a partir de secuencias de datos funcionales. ESTRUCTURA DE LA MEMORIA Esta memoria se ha organizado en tres partes. Una primera parte donde se resumen resultados previos sobre el análisis de datos espacio-temporales desde la perspectiva Geoestadística y Funcional. Una segunda parte donde se describen las contribuciones derivadas en relación con la diagonalización de modelos ARH(p), p > 0, y su aplicación a la implementación de algoritmos de filtrado, extrapolación y suavizamiento. Una última parte donde se muestran los resultados obtenidos en relación con la estimación paramétrica por máxima verosimilitud de modelos ARH(p), p > 0. A continuación se resumen los contenidos de estas tres partes: - La primera parte consta de los tres primeros capítulos. En el primer capítulo se hace referencia a las distintas técnicas usadas para la discretización ortogonal de modelos espacio-temporales basadas en la elección de una base apropiada de funciones que conduce, mediante truncamiento de dicha base, a una aproximación finito-dimensional de la ecuación de estados. Las técnicas usadas se encuadran dentro de dos ambientes distintos. Por un lado se presentan los métodos utilizados habitualmente en la Estadística Espacio-Temporal, dirigidos al análisis de variabilidades, métodos EOF y POP. Por otra parte, se describen los utilizados en la Estadística Funcional, el FPCA y la transformda wavelet. En el segundo capítulo se presentan los enfoques fundamentales utilizados en la formulación de modelos de interacción espacio-temporal. En el tercer capítulo se resume la implementación del filtrado de Kalman para modelos estadísticos espacio-temporales lineales y se comenta brevemente la metodología planteada en las técnicas EKF y UKF para el filtrado de modelos no lineales en el contexto de datos espacio-temporales. - La segunda parte consta de los capítulos cuarto y quinto. En dichos capítulos se resumen respectivamente las aportaciones derivadas en relación con la formulación de una versión funcional del Principal Oscillation Pattern Analysis unidimensional, en el caso ARH(1), y multidimensional, en el caso ARH(p), p > 0, para la obtención de una versión escalar de las ecuaciones de estados funcionales que definen los modelos ARH(1) y ARH(p), p > 0. Ejemplos de operadores de autocorrelación que forman parte del espacio de parámetros funcional considerado, cuyos elementos admiten una descomposición espectral en términos de bases de Riesz duales, son asimismo formulados, describiendo sus propiedades espectrales. Finalmente, se obtiene la implementación del filtrado de Kalman en modelos ARH(1) y ARH(p), p > 0. Los resultados obtenidos se ilustran con ejemplos numéricos, donde se generan secuencias de datos funcionales espaciales con dinámica autorregresiva, afectados por ruido funcional aditivo, a partir de los cuales se implementa el filtrado de Kalman, en términos de la descomposición POP del proceso Hilbert-valuado de interés. Se estudian diferentes ejemplos correspondientes a diferentes familias de operadores de autocorrelación o modelos funcionales de interacción espacio-temporal. - La tercera parte consta del sexto capítulo, donde se describe la implementación del algoritmo E.M. en combinación con la recursión forward y backward de Kalman para la estimación por máxima verosimilitud de los parámetros funcionales involucrados en la formulación de los modelos ARH(1) y ARH(p), p > 0. Se trata asimismo el problema de inicialización del algoritmo E.M. funcional planteado, proponiéndose diferentes alternativas en la introducción de los valores iniciales del algoritmo, a partir de la formulación funcional de estimadores de momentos para los parámetros implicados. Nuevamente, los resultados se ilustran con ejemplos numéricos donde se resuelve el problema de filtrado, extrapolación y estimación paramétrica a partir de secuencias de datos funcionales espaciales generadas mediante modelos ARH. RESULTADOS DE LA TESIS En la presente memoria titulada "Análisis Estadístico de datos Espacio-Temporales mediante Modelos Funcionales de Series Temporales" se aportan nuevas herramientas para la resolución de los problemas de estimación paramétrica funcional, filtrado y extrapolación en el contexto de series autorregresivas hilbertianas (ARH) para el análisis de secuencias de datos funcionales espaciales. Concretamente, los resultados obtenidos en esta tesis han sido: - La derivación de una versión escalar de la ecuación de estados funcional que define los modelos ARH(p), p > 0, mediante la formulación infinito-dimensional del análisis Principal Oscillation Pattern (POP), desarrollado previamente en el contexto de series temporales ordinarias. Dicha formulación proporciona en el caso ARH(1) la diagonalización de la ecuación de estados en términos de la descomposición espectral del operador de autocorrelación. En el caso ARH(p), con p>0, se obtiene la diagonalización de la ecuación de estados en términos de la descomposición espectral múltiple del espacio de parámetros multidimensional. - La implementación del filtrado de Kalman en los modelos ARH(1) y ARH(p), p>0, a partir de la descomposición POP derivada para procesos autorregresivos hilbertianos. Más concretamente, dicha implementación se obtiene mediante la proyección en los sistemas de bases de Riesz duales implicados de los operadores que definen los momentos de orden dos condicionados a la información muestral funcional. - La obtención de estimadores máximo-verosímiles para los parámetros funcionales involucrados en la formulación de los modelos ARH(p), p > 0. El cálculo de estos estimadores se obtiene a partir de la combinación del filtrado y suavizamiento de Kalman con el algoritmo EM. Los objetivos de esta tesis se inscriben en los de la línea de investigación que se desarrolla en el Departamento de Estadística e I.O. de la Universidad de Granada dentro del Proyecto Nacional de Investigación "Modelización y Análisis Estadístico de Características Locales y Propiedades de Memoria para Datos Espacio-Temporales" MTM2005-08597.