Fuzzy Quantified Protoforms for Data-To-Text Systems: a new model with applicationsa new model with applications

  1. Cascallar Fuentes, Andrea
Dirixida por:
  1. Alejandro Ramos Soto Director
  2. Alberto José Bugarín Diz Director

Universidade de defensa: Universidade de Santiago de Compostela

Fecha de defensa: 06 de maio de 2022

Tribunal:
  1. Daniel Sánchez Fernández Presidente/a
  2. José M. Alonso Moral Secretario
  3. Macarena Espinilla Estévez Vogal

Tipo: Tese

Resumo

Hoy en día se generan y consumen grandes cantidades de datos, de gran valor en la medida que pueda extraerse la información que contienen, que pueda utilizarse en los procesos de toma de decisiones. En este contexto, las herramientas que permiten comunicar de forma comprensible los resultados a humanos están todavía en desarrollo. Es ahí donde los sistemas data-to-text (D2T), que se centran en la generación automática de textos a partir de diversas fuentes de datos numéricos o simbólicos, son de gran utilidad. Dentro del área más general de la Generación de Lenguaje Natural, los sistemas D2T son capaces de procesar grandes cantidades de datos numéricos, convirtiéndolos en textos que contienen información relevante y comprensible para los usuarios, de modo que se puede extraer automáticamente información a partir de dichos datos y comunicarla de una forma intuitiva. Por otro lado, en el campo de la Lógica Borrosa han surgido propuestas para describir datos empleando términos lingüísticos, por ejemplo Descripciones Lingüísticas de Datos, que resumen de forma lingüísica una o más varaibles numéricas empleando el concepto de protoforma. El objetivo de esta tesis está compuesto por tres sub-objetivos: i) en primer lugar, extender y mejorar la fase de determinación de contenido en sistemas D2T para representar el conocimiento impreciso y la búsqueda inteligente. Para esto, consideraremos aproximaciones metaheurísticas con el objetivo de obtener un buen compromiso entre calidad de la solución y coste computacional. ii) El segundo objetivo es medir y comparar el impacto de la selección del método de cuantificación borrosa para analizar su comportamiento de forma empírica en la evaluación de sentencias cuantificadas borrosas. Por último, nuestro último objetivo ha sido iii) el diseño de un modelo D2T que cubra la arquitectura D2T utilizando sentencias cuantificadas borrosas para describir series temporales.