FP-MAXFLOW. Un algoritmo para la minería de patrones relevantes de longitud máxima.

Autores/as

  • Arnaldo Díaz Universidad de La Habana ICIDCA
  • Luciano García Universidad de La Habana

DOI:

https://doi.org/10.13053/cys-22-2-2498

Palabras clave:

Bases de datos transaccionales, Minería de asociación, reconocimiento de patrones, itemsets frecuentes.

Resumen

Los algoritmos para el reconocimiento y clasificación de itemsets en bases de datos transaccionales aspiran a satisfacer un resultado  indispensable en la obtención posterior de correlaciones en minería de asociación: encontrar los itemsets de ocurrencia más frecuente los que se constituyen en patrones para establecer posteriormente las correlaciones entre los mismos. El estado del arte muestra que la mayoría de los algoritmos obtienen el conjunto completo de itemsets en la búsqueda de  patrones, mientas que otros obtienen los patrones de longitud máxima. Ambas estrategias tienen limitaciones para la obtención de las correlaciones: obtener el conjunto completo de itemsets implica analizar muchos resultados de poca relevancia, mientras que concentrarse solo en los de longitud máxima implica la pérdida de información importante. El objetivo de este trabajo es ofrecer un nuevo algoritmo, denominado FP-MAXFLOW, para obtener un conjunto de itemsets que tomados como patrones permiten establecer  correlaciones entre conjuntos de itemsets relevantes de la mayor longitud posible y evitando redundancias. Tal resultado se obtiene con un solo recorrido de la base de datos. Los análisis comparativos demuestran que FP-MAXFLOW es competitivo con otros algoritmos que figuran entre los más utilizados.

Biografía del autor/a

Arnaldo Díaz, Universidad de La Habana ICIDCA

Arnaldo Díaz Molina es Ingeniero de Software por el Instituto Superior Politécnico José Antonio Echeverría (ISPJAE, 2011), La Habana, Cuba. Sus áreas de interés son: Ingeniería de Software, Bases de Datos, Lógica Matemática, Minería de Datos, Aprendizaje de Computadoras e Inteligencia Artificial.

Luciano García, Universidad de La Habana

Luciano García Garrrido es Profesor Titular Consultante de la Facultad de Matemática y Computación de la Universidad de La Habana. Su área de investigación compende fundamentalmente los métodos de la lógica computacional y el aprendizaje de máquina  y sus aplicaciones en la extracción de información y la minería de textos.

Descargas

Publicado

2018-06-29