Publications
Permanent URI for this collectionhttps://repositorio.grial.eu/handle/123456789/34
Browse
3 results
Search Results
Item Minería de datos para descubrir tendencias en la clasificación de los trabajos de titulación(2018-07-10) Haro, S.; Pazmiño, R.; Conde, M. Á.; García-Peñalvo, F. J.La minería de datos tiene como fin encontrar patrones que expliquen la tendencia de los datos, es por ello que con el objetivo de extraer conocimiento de los trabajos de titulación de la Facultad de Ciencias de la Escuela Superior Politécnica de Chimborazo; se aplicaron cinco modelos de clasificación: Máquinas de Soporte Vectorial, Redes Neuronales, Árbol de Decisión, Bosque Aleatorio y Potenciación; considerando las líneas Diseño de Experimentos y Análisis Multivariable. Para identificar el modelo óptimo se aplicó Rattle, se calcularon tres medidas de rendimiento, las precisiones: global, positiva y negativa; siendo la curva ROC y los Árboles de Decisión, gráficas que permitieron visualizar el modelo de predicción con mejor ajuste, así como los programas que caracterizan las líneas de investigación. Los resultados mostraron que para la línea Diseño de Experimentos, el modelo con mayor precisión fue Bosque Aleatorio, con un 71,48% de predicciones que son correctas respecto al total; mientras que al considerar la línea Análisis Multivariable no se evidenció diferencia significativa en la precisión global, fluctuando en el 97%; esto significa que con el 97% de certeza la línea de investigación de Análisis Multivariable y con el 71,48% de precisión la línea de Diseño de Experimentos se enmarcan en los programas de investigación institucionales. En el modelo Árbol de Decisión, el nodo principal fue la Carrera cuando se consideró la línea Diseño de Experimentos, debido a que en Bioquímica y Farmacia se impulsa la utilización de estudios de este tipo; y en el caso de la línea Análisis Multivariable fue el programa Consumo Humano para mejorar las condiciones de nutrición y salud, debido a que los trabajos de titulación tienen una baja utilización de técnicas multivariable.Item Métodos de agrupamiento LA & SIA: Comparación computacional(2018-07-10) Naranjo, M.; Pazmiño, R.; Conde, M. Á.; García-Peñalvo, F. J.Las analíticas de aprendizaje son y siguen siendo una tecnología emergente según el informe Horizon del 2016, es por ello por lo que el estudio y la búsqueda de nuevas técnicas de análisis es importante. El análisis Estadístico Implicativo permite descubrir R-reglas de la forma a → b sobre un conjunto de variables o sujetos. Las reglas se representan gráficamente por dendogramas que sirven como una nueva herramienta clustering basada en el concepto de cohesión. El Clustering es una de las técnicas más utilizadas en Learning Analytics para la exploración de datos para condensarlos en grupos heterogéneos de objetos similares entre sí. El objetivo de este artículo es comparar desde la ocupación de memoria las funciones cluster utilizadas en Learning Analytics hclust.vector, dendro.variables y diana y las funciones callHierarchyTree y callSimilarityTree utilizadas en el Análisis Estadístico Implicativo, esto permitirá determinar las ventajas de las nuevas técnicas de análisis cluster basadas en el Análisis Estadístico Implicativo. El análisis comparativo se realizó mediante un diseño cuasi experimental bifactorial del tipo RGXO, para controlar las variables exógenas se utilizó similares arquitecturas de hardware (Procesador Core I7, Velocidad 2,2 Ghz y Memoria RAM 8Gb) y de software (Windows 8, Ubuntu 16.04, MacOS Sierra 10.12, R v3.4.1 y RStudio v1.0.153). El colectivo de estudio estuvo conformado por 100000 bases de datos de 1000 observaciones y 100 variables dicotómicas. Se utilizó un método de muestreo aleatorio simple, el tamaño de muestra utilizado fue de 383 bases de datos. Los resultados demuestran que no existe diferencia significativa en la ocupación de memoria entre los métodos simlrty, dendro_diana y hclust_vector, es decir estadísticamente los tres métodos son equivalentes y son los que menos memoria ocupan. El método hrarchy ocupa el segundo lugar en mayor ocupación de memoria y el método que más memoria utiliza es dendro_variables.Item Statistical implicative analysis for educational data sets: 2 analysis with RCHIC(2015-11) Coutrier, R.; Pazmiño, R.; Conde-González, M. Á.; García-Peñalvo, Francisco J.En este trabajo mediante dos ejemplos mostramos nuestro interés en la utilización del Análisis Estadístico Implicativo (SIA) en la comprensión de relaciones entre datos en Educación. Con SIA y la herramienta RCHIC es posible construir, gráficos (árbol de jerarquía, grafo implicativo) en los cuales el profesor o experto pueden visualizar y comprender las implicaciones entre los datos. Recomendamos a los profesores e instituciones utilizar SIA, debido a que ésta es una herramienta que permite encontrar posibles soluciones para mejorar evaluaciones, encuestas, etc.