Una propuesta determinista para la obtención de reglas en problemas de minería de datos

  1. DOMINGUEZ OLMEDO, JUAN LUIS
Zuzendaria:
  1. Jacinto Mata Vázquez Zuzendaria

Defentsa unibertsitatea: Universidad de Huelva

Fecha de defensa: 2019(e)ko urtarrila-(a)k 15

Epaimahaia:
  1. Diego Gachet Paez Presidentea
  2. Pedro José Abad Herrera Idazkaria
  3. Víctor Manuel Rivas Santos Kidea
Saila:
  1. TECNOLOGIAS DE LA INFORMACION

Mota: Tesia

Laburpena

En esta tesis se describen con detalle los trabajos realizados para afrontar, mediante un nuevo enfoque determinista, la generación de reglas para su aplicación a problemas de minería de datos. Concretamente, y dado que la discretización previa de los atributos numéricos de un conjunto de datos, conlleva pérdida de información y posible disminución de la calidad de reglas obtenidas, se ha estudiado generar directamente reglas combinando intervalos en las condiciones de los atributos numéricos. Para reducir el tiempo de cómputo que cualquier proceso exhaustivo de búsqueda lleva implícito, se han definido diferentes estructuras de datos y se han desarrollado algoritmos para generar y evaluar, de forma eficiente, las reglas del modelo, así como los parámetros apropiados para conseguir un equilibrio entre el tiempo de cómputo y la calidad de las reglas generadas. Se ha adoptado el método propuesto a distintas tareas de minería de datos, concretamente, a la obtención de reglas de asociación, el descubrimiento de subgrupos y la clasificación. Los algoritmos desarrollados se han aplicado en diversos conjuntos de datos de prueba, comparando la bondad de las reglas resultantes con la de otros métodos existentes en la literatura. La significancia de los resultados obtenidos se ha evaluado mediante los apropiados test estadísticos. El método propuesto ha obtenido unos excelentes resultados, igualando o mejorando los de otros métodos de referencia, tanto deterministas como no deterministas. También se ha aplicado a datos reales, como el caso de un conjunto de datos médicos, donde se consiguió obtener un modelo predictivo interpretable y con gran precisión.