Procedimientos estadísticos para modelos circulares con restricciones de orden aplicados al análisis de expresiones de genes
- Barragán Andrés, Sandra
- Miguel Alejandro Fernández Temprano Director/a
- Cristina Rueda Sabater Director/a
Universidad de defensa: Universidad de Valladolid
Fecha de defensa: 19 de septiembre de 2014
- Bonifacio Salvador González Presidente/a
- José A. Menéndez Secretario/a
- Arthur Richard Pewsey Vocal
- Oscar Manuel Rueda Palacio Vocal
- Wenceslao González Manteiga Vocal
Tipo: Tesis
Resumen
En los últimos años ha surgido un interés creciente por el estudio de problemas estadísticos en modelos circulares con restricciones. Esta tesis supone una contribución a esta línea de investigación. En concreto, aborda por un lado, resolver el problema teórico de agregación de órdenes circulares y por otro lado el contraste de igualdad de órdenes circulares en dos o más poblaciones. El principal reto es realizar un tratamiento correcto de las características del espacio circular en el que se encuentran los datos. En este trabajo se presentan y evalúan diferentes métodos para agregación de órdenes circulares, algunos que utilizan técnicas novedosas como la que hace uso del problema del viajante (TSP) o la que usa herramientas de la teoría de Hodge. En relación al segundo problema, se propone un test no paramétrico para realizar el contraste de igualdad de órdenes circulares en varias poblaciones. Este procedimiento se basa en un proceso de selección aleatoria sobre los experimentos y hace uso de un estadístico estandarizado. De esta manera se tienen en cuenta posibles diferencias en la variabilidad entre y dentro de las poblaciones y el hecho de disponer de muestras no balanceadas. El estudio de estos problemas surge de la necesidad de resolver varias cuestiones en el ámbito de la biología molecular a partir del análisis de datos de expresiones de genes asociados al ciclo celular. En concreto, se trata de identificar aquellos genes cuyas funciones biológicas se han conservado en el proceso evolutivo. Como resultado de aplicar los procedimientos desarrollados en esta memoria se ha conseguido determinar un conjunto de 7 genes cuyos momentos de máxima expresión siguen el mismo orden a lo largo del ciclo celular de las tres especies comparadas (S.pombe, S.cerevisiae y Humanos), lo que significa que conservan sus funciones a lo largo del proceso evolutivo. Finalmente, con objeto de facilitar al usuario la utilización de los procedimientos diseñados se ha implementado en el lenguaje R toda la metodología desarrollada, dando lugar a un paquete denominado isocir (isotonic inference for circular data) que se encuentra disponible en el CRAN. Este paquete incluye también la implementación de procedimientos básicos de la inferencia con restricciones en modelos circulares que no habían sido implementados anteriormente en R.