Métodos numéricos de aprendizaje automático supervisado aplicados a la predicción de floraciones masivas de pseudo-nitzschia spp. En las rías baixas gallegas

  1. Bellas Aláez, Francisco Miguel
Dirixida por:
  1. Jesús Torres Palenzuela Director
  2. Luis González Vilas Co-director

Universidade de defensa: Universidade de Vigo

Fecha de defensa: 06 de maio de 2021

Tribunal:
  1. José Manuel Cotos Yáñez Presidente
  2. Ángeles Longa Portabales Secretario/a
  3. Evangelos Spyrakos Vogal

Tipo: Tese

Resumo

El desarrollo de la capacidad computacional unido a la aparición de nuevos algoritmos de predicción en el marco del machine learning está produciendo una mejora sustancial en la capacidad de conocer con anterioridad hechos de distinta índole con una adecuada base de datos sobre dicha situación. En las rías gallegas uno de los grandes problemas tanto de salud como económicos es la aparición de mareas rojas tóxicas debidas a blooms de algas como la Pseudo-nitzschia spp. En este trabajo se pretende probar varios de estos nuevos algoritmos con el objetivo de buscar la forma más adecuada de predecir estas proliferaciones de algas tóxicas, para lo cual se usan una serie de datos que se aplican a algoritmos tanto clásicos como de aparición más reciente. Mediante todas estas pruebas se obtendrán valoraciones de distintos métodos de cara a un objetivo a medio plazo de implementar un sistema de predicción de mareas rojas en tiempo real en las distintas rías gallegas. Se han usado datos obtenidos en las rías entre los años 2002 y 2012. Se han aplicado tanto en fase de entrenamiento como de validación a predictores mediante Redes Neuronales, Máquinas de Soporte Vectorial, Regresión Logística, Random Forest y AdaBoost. En el capítulo 1 se realiza una introducción a la situación actual en las rías bajas gallegas, punto de estudio, así como de los procesos de afloramiento y floraciones de algas. Se explican de forma más concreta los objetivos de este trabajo. En el capítulo 2 se describen los datos usados, así como las fuentes de dónde se obtuvieron. A continuación, se realiza una descripción matemática de los distintos algoritmos utilizados y de las métricas y formas de valoración de los mismos. Se incluye aquí la metodología completa usada. En el capítulo 3 se realiza una comparación directa de los modelos obtenidos en el trabajo previo realizado por Luis González Vilas (Codirector de esta tesis) usando los mismos grupos de variables, pero con datos obtenidos entre los años 2002 y 2012. Además de la comparación y mediante técnicas de curvas de aprendizaje se valora cómo es posible la mejora de la predicción. En el capítulo 4 se aplican en la medida de lo posible las mejoras recomendadas en el capítulo 3 mediante la adición de nuevos datos a los modelos. Además, se añaden modelos para realizar predicciones a una semana vista, que son de interés especial para el campo económico de la industria marisquera gallega. En este capítulo también se describe la realización de un algoritmo para la búsqueda de un conjunto de datos óptimo de cara a la predicción de bloom. En el capítulo 5 se comentan los resultados, se muestran conclusiones y se plantean líneas futuras de investigación a partir del trabajo realizado.