Una propuesta determinista para la obtención de reglas en problemas de minería de datos

  1. DOMINGUEZ OLMEDO, JUAN LUIS
Dirigida por:
  1. Jacinto Mata Vázquez Director

Universidad de defensa: Universidad de Huelva

Fecha de defensa: 15 de enero de 2019

Tribunal:
  1. Diego Gachet Paez Presidente/a
  2. Pedro José Abad Herrera Secretario
  3. Víctor Manuel Rivas Santos Vocal
Departamento:
  1. TECNOLOGIAS DE LA INFORMACION

Tipo: Tesis

Resumen

En esta tesis se describen con detalle los trabajos realizados para afrontar, mediante un nuevo enfoque determinista, la generación de reglas para su aplicación a problemas de minería de datos. Concretamente, y dado que la discretización previa de los atributos numéricos de un conjunto de datos, conlleva pérdida de información y posible disminución de la calidad de reglas obtenidas, se ha estudiado generar directamente reglas combinando intervalos en las condiciones de los atributos numéricos. Para reducir el tiempo de cómputo que cualquier proceso exhaustivo de búsqueda lleva implícito, se han definido diferentes estructuras de datos y se han desarrollado algoritmos para generar y evaluar, de forma eficiente, las reglas del modelo, así como los parámetros apropiados para conseguir un equilibrio entre el tiempo de cómputo y la calidad de las reglas generadas. Se ha adoptado el método propuesto a distintas tareas de minería de datos, concretamente, a la obtención de reglas de asociación, el descubrimiento de subgrupos y la clasificación. Los algoritmos desarrollados se han aplicado en diversos conjuntos de datos de prueba, comparando la bondad de las reglas resultantes con la de otros métodos existentes en la literatura. La significancia de los resultados obtenidos se ha evaluado mediante los apropiados test estadísticos. El método propuesto ha obtenido unos excelentes resultados, igualando o mejorando los de otros métodos de referencia, tanto deterministas como no deterministas. También se ha aplicado a datos reales, como el caso de un conjunto de datos médicos, donde se consiguió obtener un modelo predictivo interpretable y con gran precisión.