Bridging the gap between distance and generalisation: symbolic learning in metric spaces

Estruch Gregori, Vicente

Bridging the gap between distance and generalisationsymbolic learning in metric spaces

Estruch Gregori, Vicente

Dirixida por:

José Hernández Orallo Director
M. José Ramírez Quintana Director

Universidade de defensa: Universitat Politècnica de València

Fecha de defensa: 05 de decembro de 2008

Tribunal:

María Alpuente Frasnedo Presidente/a
Marco Comini Secretario/a
Purificación Cariñena Amigo Vogal
Peter Flach Vogal
Nicolás Lachiche Vogal

Tipo: Tese

Teseo: 270522 DIALNET

Resumo

El aprendizaje automático es la disciplina que se centra en el diseño de algoritmos que pueden aprender a partir de datos recogidos de la experiencia. Muchos de estos algoritmos son fundamentales en aplicaciones tales como minería de datos, lingüística computacional, visión artificial, etc. Sin embargo, a pesar de la aplicabilidad de estos algoritmos y su alto rendimiento mostrado en problemas reales, nos encontramos con la situación que muchos de ellos están diseñados para contextos muy particulares. Esto equivale a decir que los algoritmos existentes deben ser rediseñados o que nuevos algoritmos deben ser inventados cada vez que el contexto de aprendizaje varíe. Por este motivo, existe un gran interés en desarrollar métodos de propósito general que puedan ser ejecutados o sistemáticamente adaptados a diferentes escenarios de aprendizaje. Uno de estos escenarios hace referencia a la representación de los datos. En términos generales, los datos o ejemplos recogidos se representan mediante tuplas de componentes numéricas y/o categóricas (representación proposicional de los datos) o usando otros formalismos más complejos pero a su vez más expresivos que involucran estructuras tales como conjuntos, secuencias, grafos, etc. (datos estructurados). Así pues, el objetivo principal es obtener algoritmos de aprendizaje cuyo diseño sea lo más independiente posible de la representación de los datos que haya sido utilizada. En la línea de diseñar métodos de aprendizaje que puedan tratar con o adaptarse a diferentes representaciones de los datos, encontramos en la literatura diferentes aproximaciones que se ubican principalmente en dos grupos diferentes: los llamados métodos basados en distancias (o de forma más genérica, métodos basados en similitud) y los métodos simbólicos. Cada uno de estos grupos de métodos tiene sus propias ventajas e inconvenientes