Métodos para la inducción de conocimiento en aprendizaje supervisado utilizando algoritmos evolutivos.

  1. Álvarez Macías, José Luis
Supervised by:
  1. José Cristobal Riquelme Santos Director

Defence university: Universidad de Sevilla

Fecha de defensa: 13 December 2002

Committee:
  1. José Miguel Toro Bonilla Chair
  2. Macario Polo Usaola Secretary
  3. Isabel Ramos Román Committee member
  4. José Javier Dolado Cosín Committee member
  5. José Manuel Andújar Márquez Committee member

Type: Thesis

Teseo: 96116 DIALNET

Abstract

El objetivo perseguido en esta tesis viene motivado por la inquietud de resolver, mediante la aplicación de algoritmos evolutivos (AE), dos problemas detectados en el sistema C4.5. El primero de ellos, es la limitación para inducir modelos de clasificación con fronteras no ortogonales y el segundo, la escasa adecuación de los resultados para facilitar la interpretación a un experto humano. Una primera contribución, en relación con el primer problema, ha sido el desarrollo de la herramienta CGO cuya base es el propio C4.5 y un AE. Esta herramienta dispone de las ventajas del C4.5 y, mediante el AE, tiene la capacidad de inducir modelos de clasificación oblicuos. Por otro lado, se ha desarrollado COBLI que, mediante un AE, permite inducir un modelo de clasificación oblicuo no jerárquico. Los hiperplanos que conforman este modelo de clasificación determinan regiones no ortogonales en el espacio de búsqueda para cada una de las clases. Finalmente, en relación con el primer problema, se presenta la herramienta CGC basada, al igual que CGO, en el C4.5 y un AE, con la diferencia que, esta última, induce modelos de clasificación basados en superficies cónicas. Esta herramienta presenta como ventaja la posibilidad de inducir regiones de una clase, incluidas dentro de una región de otra clase. El segundo problema, sobre el que se ofrecen mejoras, es la preocupación por acercar el modelo de clasificación inducida hacia una fácil interpretación por parte de un experto humano. Así, se ha implementado la herramienta ELIPSES que, como CGC, está basada en la inducción de regiones cónicas. A diferencia de CGC, ésta ofrece un modelo semicualitativo del conocimiento extraído y una visualización gráfica. Finalmente, esta tesis contribuye, en el campo de la ingeniería del software, a la mejora de los procesos de desarrollo. Para ello, se ha aplicado ELIPSES a un conjunto de bases de datos generadas mediante la simulació