Métodos de agrupamiento LA & SIA: Comparación computacional

Thumbnail Image

Date

2018-07-10

Authors

Naranjo, M.
Pazmiño, R.
Conde, M. Á.
García-Peñalvo, F. J.

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Las analíticas de aprendizaje son y siguen siendo una tecnología emergente según el informe Horizon del 2016, es por ello por lo que el estudio y la búsqueda de nuevas técnicas de análisis es importante. El análisis Estadístico Implicativo permite descubrir R-reglas de la forma a → b sobre un conjunto de variables o sujetos. Las reglas se representan gráficamente por dendogramas que sirven como una nueva herramienta clustering basada en el concepto de cohesión. El Clustering es una de las técnicas más utilizadas en Learning Analytics para la exploración de datos para condensarlos en grupos heterogéneos de objetos similares entre sí. El objetivo de este artículo es comparar desde la ocupación de memoria las funciones cluster utilizadas en Learning Analytics hclust.vector, dendro.variables y diana y las funciones callHierarchyTree y callSimilarityTree utilizadas en el Análisis Estadístico Implicativo, esto permitirá determinar las ventajas de las nuevas técnicas de análisis cluster basadas en el Análisis Estadístico Implicativo. El análisis comparativo se realizó mediante un diseño cuasi experimental bifactorial del tipo RGXO, para controlar las variables exógenas se utilizó similares arquitecturas de hardware (Procesador Core I7, Velocidad 2,2 Ghz y Memoria RAM 8Gb) y de software (Windows 8, Ubuntu 16.04, MacOS Sierra 10.12, R v3.4.1 y RStudio v1.0.153). El colectivo de estudio estuvo conformado por 100000 bases de datos de 1000 observaciones y 100 variables dicotómicas. Se utilizó un método de muestreo aleatorio simple, el tamaño de muestra utilizado fue de 383 bases de datos. Los resultados demuestran que no existe diferencia significativa en la ocupación de memoria entre los métodos simlrty, dendro_diana y hclust_vector, es decir estadísticamente los tres métodos son equivalentes y son los que menos memoria ocupan. El método hrarchy ocupa el segundo lugar en mayor ocupación de memoria y el método que más memoria utiliza es dendro_variables.

Description

Keywords

analíticas de aprendizaje, análisis estadístico implicativo, métodos cluster, callSimilarityTree, dendro.variables, RCHIC

Citation

Collections

Endorsement

Review

Supplemented By

Referenced By