Pronóstico del resultado en las pruebas Saber Pro a partir de variables socioeconómicas, del puntaje de las pruebas Saber 11 y del carácter de la universidad para siete programas de ingeniería utilizando técnicas de aprendizaje automático

Loading...
Thumbnail Image

Date

2021

Authors

Soto Acevedo, Misorly del Carmen

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

En el presente trabajo de investigación se desarrolla un modelo de predicción de los resultados en las pruebas Saber Pro de los programas de ingeniería civil, eléctrica, electrónica, industrial, mecánica, mecatrónica y química en Colombia, mediante técnicas de aprendizaje automático; para esto se diseña una metodología que se enmarca bajo un enfoque de análisis de los datos cuantitativos, en el área conocida como Analítica del Aprendizaje (Learning Analytics). Esta metodología se compone en tres etapas: primero, análisis y depuración de la base de datos; segundo, el análisis multivariado, se recurre al análisis descriptivos, formulación de hipótesis para diferencia de proporciones y en la búsqueda de asociación entre variables que determinan los resultados favorables de las pruebas de Estado estandarizadas; y tercero, la aplicación de las técnicas de aprendizaje automático para brindar soporte a los resultados obtenidos en la implementación de técnicas supervisadas para la elección de variables importantes en este proceso de investigación, además la predicción del desempeño de los estudiantes en las pruebas de Estado. Por su parte, en la investigación se concluye mediante el análisis descriptivo y exploratorio que existe asociación entre las variables UANA (Universidad acreditada o no acreditada), PANA (Programa acreditado o no acreditado) y los diferentes niveles de desempeño de las áreas en las pruebas Saber 11 y la variable a predecir (nivel de desempeño de la prueba Saber Pro). Se encuentra que el algoritmo de aprendizaje automático que se ajusta adecuadamente al problema de la investigación es el Modelo Lineal Generalizado en Red (GLMNET) y esto se evidencia en el desempeño presentado en la etapa de entrenamiento y en la etapa de evaluación. Para la etapa de entrenamiento los resultados del modelo en Accuracy, AUC, Sensitivity y Specificity fueron 0.810, 0.820, 0.813 y 0.827 respectivamente; luego, en su etapa de evaluación los resultados del modelo en Accuracy, AUC, Sensitivity y Specificity fueron 0.820, 0.820, 0.827 y 0.813 respectivamente. La investigación permitió realizar un pronóstico de los resultados de cada estudiante y de esta manera poder tomar decisiones de estrategias de refuerzo para mejorar los resultados en las pruebas Saber Pro. Por todo lo anterior, el modelo propuesto permite identificar grupos de estudiantes que podrían tener bajos resultados en las pruebas Saber Pro con el fin de crear estrategias durante todo el proceso de enseñanza-aprendizaje para estos estudiantes y de esta manera mejorar su formación académica, mejorar los resultados de las pruebas Saber Pro y potencializar su desempeño profesional y laboral. Este trabajo es replicable a otras áreas de conocimiento debido a que es una herramienta versátil, se puede implementar a otros contextos de interés según la investigación.

Description

Keywords

Citation

Soto Acevedo, Misorly. Pronóstico del resultado en las pruebas Saber Pro a partir de variables socioeconómicas, del puntaje de las pruebas Saber 11 y del carácter de la universidad para siete programas de ingeniería utilizando técnicas de aprendizaje automático. 2021 . Tesis de Maestría. Universidad Tecnológica de Bolívar.