Fast k-nearest neighbors for Big Data and Smart Data

  1. Maillo Hidalgo, Jesús
Dirigida por:
  1. Francisco Herrera Triguero Director/a
  2. Isaac Triguero Velázquez Director/a

Universidad de defensa: Universidad de Granada

Fecha de defensa: 07 de mayo de 2020

Tribunal:
  1. Óscar Cordón García Presidente/a
  2. Victoria Luzón García Secretario/a
  3. Antonio Peregrín Rubio Vocal
  4. Daniel Peralta Cámara Vocal
  5. Javier del Ser Lorente Vocal

Tipo: Tesis

Resumen

En esta tesis hemos presentado un amplio estudio sobre el algoritmo kNN en problemas Big Data y su uso para transformar grandes conjuntos de datos en Smart Data. Como objetivo se ha planteado el diseño, implementación, análisis y evaluación de los algoritmos propuestos. Comienza con la propuesta escalable y exacta del algoritmo kNN y se extiende con la mejora aproximada de FkNN. Posteriormente, se ha analizado la implicación del algoritmo kNN en la obtención de Smart Data, destacando la propuesta como imputador de MVs. Finalmente, se han propuesto dos métricas de complejidad y densidad específicas para problemas Big Data con el propósito de estudiar la redundancia de información en conjuntos de datos de gran escala.