Estudio empírico del enfoque asociativo en el contexto de los problemas de clasificación

Autores/as

  • Laura Cleofas Sánchez Instituto Politécnico Nacional, Sección de Posgrado, E.S.I.M.E.
  • Anabel Pineda Briseño Tecnológico Nacional de México, Instituto Tecnológico de Matamoros
  • Rosa María Valdovinos Rosas Universidad Autónoma del Estado de México, Facultad de Ingeniería
  • José Salvador Sánchez Garreta Universidad de Jaume I, Instituto de Nuevas Tecnologías de la Imagen, Departamento de Lenguajes y Sistemas de la Informática, Castellón de la Plana
  • Vicente García Jiménez Universidad Autónoma de la Ciudad de Juárez, Departamento de Ingeniería Eléctrica y Computación, Ciudad de Juárez, Chihuahua
  • Oscar Camacho Nieto Instituto Politécnico Nacional, Centro de Investigación en Computación
  • Héctor Pérez Meana Instituto Politécnico Nacional, Sección de Posgrado, E.S.I.M.E.
  • Mariko Nakano Miyatake Instituto Politécnico Nacional, Sección de Posgrado, E.S.I.M.E.

DOI:

https://doi.org/10.13053/cys-23-2-3026

Palabras clave:

Recuperación, clasificación, enfoque asociativo, redes neuronales, C4.5, SVM, desequilibrio, solapamiento, patrones atípicos, Wilson, selectivo, SMOTE

Resumen

Investigaciones realizadas por la comunidad científica han evidenciado que el rendimiento de los clasificadores, no solamente depende de la regla de aprendizaje, sino también de las complejidades inherentes en los conjuntos de datos. Algunos clasificadores se han utilizado habitualmente en el contexto de losproblemas de clasificación (tres Redes neuronales, C4.5, SVM, entre otros). No obstante, el enfoque asociativo se ha explorado más en en el ámbito de recuperación, que en la tarea de clasificación, y su rendimiento se ha analizado escasamente cuando se presentan varias complejidades en los datos. La presente investigación analiza el rendimiento del enfoque asociativo (CHA, CHAT y Alfa Beta original) cuando se presentan tres problemas de clasificación (desequilibrio de las clases, solapamiento y patrones atípicos). Los resultados evidencian que el CHAT reconoce mejor la clase minoritaria en comparación con el resto de los clasificadores en el contexto del desequilibrio de las clases. Sin embargo, el modelo CHA ignora la clase minoritaria en la mayoría de los casos. Además, el modelo CHAT exhibe la necesidad de requerir de fronteras de decisión bien definidas cuando se aplica el método de Wilson, ya que su rendimiento se incrementa. También, se notó que cuando se enfatiza un equilibrio entre las tasas, el rendimiento de tres clasificadores incrementa (CHAT, RB y RFBR). El modelo Alfa beta original sigue mostrando un desempeño pobre cuando se realiza el pre-procesamiento en los datos. El rendimiento de los clasificadores incrementa significativamente al aplicarse el método SMOTE, situación que no se presenta sin un pre-procesamiento o submuestreo, en el contexto del desequilibrio de las clases.

Biografía del autor/a

Laura Cleofas Sánchez, Instituto Politécnico Nacional, Sección de Posgrado, E.S.I.M.E.

Me encuentro cosimionada por CONACyT (cátedras) como profesor Investigador, en ell Instituto Politécnico Nacional,  en la sección de posgrado de ESIME, culhuacan. Tengo el Doctorado en Ciencias de la Computación por el CIC-IPN.

Descargas

Publicado

2019-06-27