Maestría en Estadística Aplicada
Permanent URI for this collectionhttps://hdl.handle.net/20.500.12585/11795
Browse
Recent Submissions
Item Factor determinante de la calidad de vida de los jóvenes en el mundo: una mirada desde las técnicas multivariantes.(2022) Batista García, Freddy de Jesús; Medina Hernández, Edith Johana; Hurtado Márquez, Julio Seferino; De la Hoz Domínguez, Enrique JoséLa presente investigación tiene como objetivo principal evaluar la relación existente entre el progreso social de las juventudes y la calidad de las Instituciones Económicas Inclusivas –IEI- en 139 países del mundo. Las IEI fueron medidas atreves del indicador de eficiencia de la justicia, el derecho a la propiedad privada, la integridad de los gobiernos y las libertades económicas del Índice de Libertad Económica –ILE-, mientras que el progreso social de los jóvenes fue representado por medio del Índice de Progreso Social de las Juventudes –IPJ-. Se utilizaron distintas técnicas estadísticas para representar y probar la relación entre las variables, dentro de ellas el análisis gráfico, las pruebas de hipótesis, el análisis de componentes principales –PCA-, arboles de clasificación y reglas de asociación. Dentro de los resultados se puede destacar que los países con mejores condiciones de vida en sus jóvenes se caracterizan principalmente por contar con sistemas judiciales eficientes, bajos niveles de corrupción en los gobiernos y el respeto por la propiedad privadaItem Identificación temprana de enfermedades laborales usando Machine Learning: el caso de una empresa avícola en Cartagena, Colombia(2021) Villadiego Solano, Nelson Manuel; Hahn De Castro, Lucas WilfriedEl Presente trabajo de investigación busca encontrar un modelo de machine learning que permita analizar e identificar de manera temprana las enfermedades laborales en los trabajadores de una empresa avícola en la ciudad de Cartagena – Colombia. Para esta investigación se creó una base de datos con información suministrada por la empresa, donde se relacionan los conceptos salariales, la jornada complementaria, el área donde se desempeña, el tiempo de servicio en la empresa y la edad de cada trabajador vinculado directamente a esta. La variable respuesta identifica a los trabajadores que han sido diagnosticados con enfermedad laboral, representada como un elemento binario. Para crear el modelo se utilizaron las técnicas de Regresión logística, Random forest, Redes neuronales, SVM, Árbol de decisión y XGBoost. Se utilizó un entrenamiento basado en validación cruzada y se evidenció que los modelos con mejor desempeño fueron XG Boost y Árbol de decisión, decantándonos por el primero que mostró los siguientes ajustes AUC = 78.05% y Sensitivity = 91.66%, se concluye que la aplicación de Machine Learning hace posible identificar de forma temprana las enfermedades laborales en la empresa avícolaItem Perspectivas de la paz a nivel global: Un análisis multivariante desde indicadores ODS(2022) Marbello Yepes, Kelly Johanna; Medina Hernández, Edith Johana; Hurtado Márquez, Julio Seferino; Garcés Prettel, Miguel EfrénLa presente investigación tiene como objetivo principal analizar la paz como dimensión del desarrollo sostenible de las naciones del mundo buscando estudiar mediante las técnicas multivariantes: Análisis de Componentes Principales, Gráficos Biplot y Análisis de Clúster, las asociaciones existentes entre 8 indicadores pertenecientes a los Objetivos de Desarrollo Sostenible (ODS) 16, según datos reportados por 145 países del mundo con corte al año 2021. Se buscó describir las diferencias y similitudes observadas entre países, según si estos pertenecen al Norte y Sur global y desde 4 regiones o continentes: África (45 países), América (25 naciones), Asia-Oceanía (37países) y Europa (38 países). También se analizó las estructuras de covariación existente entre los indicadores, para observar la pertinencia de conformar grupos o clúster de naciones. Desde los resultados obtenidos se concluyó heterogeneidad entre naciones y regiones frente a la búsqueda de la paz, siendo el índice de percepción de la corrupción, una de las características que genera mayor diferenciación entre países. También se obtuvo seis grupos o clúster de naciones que permitieron resumir los retos que se visualizan actualmente a nivel global, para fomentar la paz, la justicia y la constitución de instituciones gubernamentales sólidas.Item Metodología multivariada para estimar el valor agregado en Instituciones de Educación Superior(2022) Payares Martinez, Nancy Carolina; De la Hoz Domínguez, Enrique José; Domínguez, Andy; Sierra, DavidLa calidad de la educación en las universidades públicas y privadas es un tema de interés para gobiernos, organismos y autores nacionales e internacionales debido a que esta impulsa la evolución de la sociedad. En Colombia, el Ministerio de Educación Nacional (MEN) a través del Instituto Colombiano para la Evaluación de la Educación (ICFES) propuso la medición del indicador de valor agregado para estimar el efecto que tiene en un estudiante su paso por la universidad evidenciado a través del desarrollo de sus competencias. En este trabajo se analiza el valor agregado que aportan las instituciones de educación superior a sus estudiantes a través de los resultados en las pruebas Saber 11 de 2012 a 2014 y Saber Pro de 2018 de estudiantes de 134 universidades del país, publicados por el Ministerio de Educación Nacional a través del Instituto Colombiano para la Evaluación de la Educación (ICFES). Para esto, se desarrolla una metodología multivariada basada en el análisis de componentes principales (ACP), análisis de conglomerados y Análisis Envolvente de Datos (DEA). Los principales resultados de la metodología aplicada son: los estudiantes que obtienen los mejores resultados en las pruebas Saber 11 estudian en colegios de tipo académico, colegios privados, cuentan con internet; la mayoría de las universidades que obtienen los mejores resultados en Saber Pro están acreditadas y son privadas. La mayor parte de las universidades que generan los mejores resultados en Saber Pro en los estudiantes de Ingeniería Industrial, tienen el programa acreditado. De las universidades que admiten a estudiantes con puntaje global desfavorable las que más generan mejores resultados en comunicación escrita son la Escuela de Administración y Mercadotecnia del Quindío, la Universidad Manuela Beltrán sede Bogotá, la Corporación Universitaria Minuto de Dios y la Corporación Universitaria Piloto de Colombia, puesto que a pesar de sus resultados en puntaje global logran que sus estudiantes obtengan resultados altos en comunicación escrita de Saber Pro. De las universidades que admiten estudiantes con puntaje global favorable, las que generan mejores resultados en comunicación escrita de Saber Pro son la Universidad de la Guajira, la Universidad Francisco de Paula Santander sede Ocaña y la Corporación universitaria del Meta. A través del modelo DEA se obtiene que de las 78 universidades que conforman el grupo 1, el 23,08% reciben estudiantes con oportunidades de mejora en MAT_S11 y los sacan adelante académicamente en QR_PRO, el 21,79% los reciben con ineficiencias en CR_S11 y los entregan eficientes en CR_PRO, el 39.74% los reciben con dificultades en ENG_S11 y logran mejorar esta competencia en ENG_PRO, y 7.69% los reciben con oportunidades de mejora en CC_S11 y los sacan adelante académicamente en CC_PRO. Por otra parte, de las 56 universidades que conforman el grupo 2, el 23,21% reciben estudiantes con oportunidades de mejora en MAT_S11 y los sacan adelante académicamente en QR_PRO, el 37,5% los reciben con ineficiencias en CR_S11 y los entregan eficientes en CR_PRO, el 16,07% los reciben con dificultades en ENG_S11 y logran mejoran esta competencia en ENG_PRO, y 30,36% los reciben con oportunidades de mejora en CC_S11 y los sacan adelante académicamente en CC_PRO.Item Pronóstico del resultado en las pruebas Saber Pro a partir de variables socioeconómicas, del puntaje de las pruebas Saber 11 y del carácter de la universidad para siete programas de ingeniería utilizando técnicas de aprendizaje automático(2021) Soto Acevedo, Misorly del Carmen; De la Hoz Domínguez, Enrique JoséEn el presente trabajo de investigación se desarrolla un modelo de predicción de los resultados en las pruebas Saber Pro de los programas de ingeniería civil, eléctrica, electrónica, industrial, mecánica, mecatrónica y química en Colombia, mediante técnicas de aprendizaje automático; para esto se diseña una metodología que se enmarca bajo un enfoque de análisis de los datos cuantitativos, en el área conocida como Analítica del Aprendizaje (Learning Analytics). Esta metodología se compone en tres etapas: primero, análisis y depuración de la base de datos; segundo, el análisis multivariado, se recurre al análisis descriptivos, formulación de hipótesis para diferencia de proporciones y en la búsqueda de asociación entre variables que determinan los resultados favorables de las pruebas de Estado estandarizadas; y tercero, la aplicación de las técnicas de aprendizaje automático para brindar soporte a los resultados obtenidos en la implementación de técnicas supervisadas para la elección de variables importantes en este proceso de investigación, además la predicción del desempeño de los estudiantes en las pruebas de Estado. Por su parte, en la investigación se concluye mediante el análisis descriptivo y exploratorio que existe asociación entre las variables UANA (Universidad acreditada o no acreditada), PANA (Programa acreditado o no acreditado) y los diferentes niveles de desempeño de las áreas en las pruebas Saber 11 y la variable a predecir (nivel de desempeño de la prueba Saber Pro). Se encuentra que el algoritmo de aprendizaje automático que se ajusta adecuadamente al problema de la investigación es el Modelo Lineal Generalizado en Red (GLMNET) y esto se evidencia en el desempeño presentado en la etapa de entrenamiento y en la etapa de evaluación. Para la etapa de entrenamiento los resultados del modelo en Accuracy, AUC, Sensitivity y Specificity fueron 0.810, 0.820, 0.813 y 0.827 respectivamente; luego, en su etapa de evaluación los resultados del modelo en Accuracy, AUC, Sensitivity y Specificity fueron 0.820, 0.820, 0.827 y 0.813 respectivamente. La investigación permitió realizar un pronóstico de los resultados de cada estudiante y de esta manera poder tomar decisiones de estrategias de refuerzo para mejorar los resultados en las pruebas Saber Pro. Por todo lo anterior, el modelo propuesto permite identificar grupos de estudiantes que podrían tener bajos resultados en las pruebas Saber Pro con el fin de crear estrategias durante todo el proceso de enseñanza-aprendizaje para estos estudiantes y de esta manera mejorar su formación académica, mejorar los resultados de las pruebas Saber Pro y potencializar su desempeño profesional y laboral. Este trabajo es replicable a otras áreas de conocimiento debido a que es una herramienta versátil, se puede implementar a otros contextos de interés según la investigación.Item Efecto de la aplicación de pre-procesamiento de imágenes en el rendimiento de redes neuronales convolucionales para la clasificación de pacientes con COVID-19 y neumonía a partir de imágenes de radiografías de tórax(2022) Barrios Roqueme, Luis Ramón; Patiño Vanegas, Alberto; Patiño Saucedo, Alberto; Solano Correa, YadyEn este trabajo se realiza un estudio del efecto de aplicar pre-procesamiento de imáagenes de rayos-X en tórax en el rendimiento de redes neuronales convolucionales, para diagnosticar pacientes con COVID-19, neumonía y sin ninguna de estas dos enfermedades (normal). Los pre-procesamientos de las im´agenes que se han escogido son la ecualizaci´on de histograma (Global y Adaptativo limitado por contraste, CLAHE) y el pseudocoloreado (HSV y JET). Las arquitecturas de redes neuronales escogidas son VGG16, ResNet50, MobileNet y Xception. Utilizando el valor promedio del Accuracy, la arquitectura que presenta mejor rendimiento es MobileNet (90,52 %), seguida de ResNet50 (78,04 %), VGG16 (69,41 %) y Xception (60,94 %). Sin embargo, cuando se realiza pre-procesamento la arquitectura que mejor rendimiento presenta es ResNet50 (99,96 %), seguida de MobileNet (99,79 %), VGG16 (95,79 %) y Xception (88,31 %). Con todas las arquitecturas el rendimiento es mejor cuando se realiza CLAHE.Item Análisis de la variación genética tipo snp’s en genes relacionados con la nutrición de una población de afrodescendientes colombianos San Basilio de Palenque(2021) Pérez Aguilar, Mariela; Acevedo Patiño, Óscar; Marrugo, Javier; Cabrera Tovar, Jairo Humberto; Villa Ramírez, José Luis; Marrugo Hernández, Andrés Guillermo; Acevedo Chedid, Jaime; Ríos Diaz, Yennifer Yuliana; Coronado Hernández, Óscar Enrique; Campillo Jiménez, Javier EduardoA causa de la influencia que tiene el factor genético en el desarrollo de las enfermedades crónicas, caracterizadas por ser enfermedades de larga duración, que no se transmiten directamente de persona a persona, por lo general la curación no es total y cuyo progreso suele ser muy lento, se hace necesario desarrollar un estudio relacionado con la identificación de variantes genéticas presentes en genes y que estén asociados en el desarrollo de alguna enfermedad. Debido a ello, este trabajo, se desarrolla un análisis de variantes genéticas en genes relacionados con la nutrición, a la población de afrodescendientes colombianos San Basilio de Palenque declarada por la UNESCO como “Obra maestra del patrimonio Oral e inmaterial de la humanidad ” [1], con la finalidad de encontrar asociaciones entre las variantes con las enfermedades crónicas, permitiendo facilitar un oportuno diagnóstico y en lo posible hacer recomendaciones nutricionales que les mejore la calidad de vida. Para ello, se analizan los genomas de 34 individuos de la población de San Basilio de Palenque, en donde a través de la la aplicación de métodos estadísticos se identificarán y analizaran las variantes genéticas encentradas en los genes relacionadas con la nutrición, que permitan, establecer las enfermedades asociadas a dicho genes, con el propósito de caracterizar la población de San Basilio de Palenque y en lo posible hacer recomendaciones en cuanto a la dieta para mejorar su calidad de vida. El objetivo de de este trabajo, es encontrar información suficiente acerca de los métodos estadísticos empleados para un análisis de variantes genéticas en genes relacionados con la nutrición en la población de ancestría africana San Basilio de Palenque, lo cual sea insumo para replicarlo en futuros trabajos. Vale resaltar que estudios relacionados con la relación existente entre la nutrición y las enfermedades crónicas a través del componente genético de los habitantes de esta población, aún no ha sido estudiado. En este trabajo se hará énfasis en los métodos estadísticos empleados para el análisis de las variantes genéticas encontradas en los genomas de 34 individuos de San Basilio de Palenque, haciendo una análisis a través de su distribución por cromosoma, el cálculo de frecuencias alélicas y genotípicas que permitan la verificación de que las variantes cumplen con el el equilibrio de Hardey Weinberg, la aplicación de un método basado en SILE para relacionar las enfermedades y finalmente, la identificación de las enfermedades crónicas asociadas a genes relacionados con la nutrición.Item Factores asociados a la infección urinaria luego de una prostatectomía(2021) Paillier González, Cecilia; Paillier González, Jaime Enrique (Asesor)La cirugía de próstata es un procedimiento frecuente en varones mayores. Existen diferentes técnicas cuya elección depende de la patología a tratar, experiencia del especialista y disponibilidad técnica. Entre sus complicaciones se encuentran la infección del tracto urinario, que ocasiona incremento en la morbimortalidad y costos para el sistema de salud. El objetivo principal de este estudio fue identificar los factores relacionados con la aparición de infección urinaria luego de la cirugía prostática. Para esto, se realizó un estudio de casos y controles en una población de pacientes sometidos a prostatectomía desde el año 2018 hasta principios de 2020 en la ciudad de Medellín, Colombia. La medida de asociación usada fue Odds, cuyo ajuste para factores de confusión se realizó con una regresión logística y se contrastó con un modelo aditivo generalizado multivariado. Se identificaron 96 casos incidentes de infección del tracto urinario luego de la prostatectomía, para una prevalencia de 9.1%. La frecuencia de solicitud de urocultivo preoperatorio fue de 52.92% (IC: 48.34 – 57.44). Las variables independientes asociadas con el desenlace fueron: solicitud de urocultivo prequirúrgico, número de dosis de profilaxis y tipo de antibiótico. Particularmente se encontró como factor protector, el uso de aminoglucósidos en los esquemas de profilaxis. Los principales gérmenes etiológicos de la infección urinaria fueron: Eschirichia coli, Pseudomonas aeruginosa, Klepsiella pneumoniae, Enterococos faecalis y Serratia marcescens. Basados en lo anterior, este estudio demuestra que factores como la solicitud preoperatoria de urocultivo, el uso de aminoglucósidos y, de manera menos consistente, el número de dosis de profilaxis, influyen en la probabilidad de desarrollar una infección urinaria luego de una prostatectomíaItem Aplicación de un Modelo de Sobrevivencia con Fracción de Cura en Pacientes que Realizan una Segunda Profilaxis Post-Exposición al VIH(2021) Baron Cardenas, Jorge Alberto; Brango Garcia, Hugo Alberto (director)La Profilaxis Post-Exposición para el VIH (PEP) es una herramienta de prevención que consiste en el uso de fármacos antirretrovirales para reducir el riesgo de infección luego de situaciones de potencial exposición al VIH. Cuando se inicia dentro de las 72 horas del episodio de potencial exposición, la PEP reduce en forma significativa el riesgo de transmisión, por lo que su uso se recomienda en exposiciones ocupacionales y no ocupacionales, la eficiencia del tratamiento en gran medida depende en que el paciente cumpla con los tiempos asignados en la ingesta de estos fármacos. Una proporción de los individuos que buscan un primer servicio de PEP tienden a exponerse nuevamente al virus y buscan por segunda vez un tratamiento de PEP. En este trabajo se analiza el tiempo hasta la búsqueda de un segundo servicio de PEP al VIH, para lo cual se tomó la información de 1010 pacientes que presentaron una exposición potencial no ocupacional en la ciudad de Sao Paulo, Brasil; para ello se realizó un análisis de sobrevivencia. En este análisis se ajustó un modelo de fracción de cura semiparamétrico y otro paramétrico, con el propósito de investigar la existencia de una proporción de individuos que no son susceptibles al evento de interés, el cual en este caso es la búsqueda del segundo servicio de PEP. Adicionalmente, se ajustó un modelo clásico de análisis de sobrevivencia en presencia de covariables, a través de los modelos de riesgos proporcionales de Cox. Los tres modelos presentaron un ajuste satisfactorio, aunque el modelo de fracción de cura semiparametrico presentó un mejor ajuste y proporcionó información complementaria al modelo de Cox multivariado en relación a los participantes que no regresan para la segunda PEP. Para este modelo los covariables colores de piel, sexo vaginal sin protección y prostitución influyeron en la fracción de cura, mientras que la prostitución en el tiempo de sobrevivencia de los pacientes susceptibles, para lo cual se tiene que la tasa de sujetos en prostitución que realizan una segunda PEP es 2.42 veces la de los que no están en prostitución, de igual forma esta tasa en los sujetos de color de piel negra es de 1.96 veces la de los no negros.Item Análisis de factores de vulnerabilidad y percepción de seguridad de los habitantes de la calle en ColombiaVilla Moncaris, Deivinso; Medina Hernández, Edith Johana (asesor)En Colombia es importante estudiar la población de habitantes de calle, tanto desde el punto de vista cualitativo como cuantitativo, porque el estado colombiano debe proteger y garantizar sus derechos como ciudadanos, adicionalmente al caracterizar los factores que determinan su condición de calle se pueden generar estrategias de intervención para facilitar su reintegración a la sociedad. En este trabajo de grado se utilizan datos del último censo de habitantes de calle CHC- 2019, desarrollado por el Departamento Administrativo Nacional de Estadística (DANE) en los departamentos de Atlántico, Antioquia, Caldas, Santander y Valle del Cauca; para mediante la aplicación de las técnicas: Análisis de Correspondencias Múltiples (ACM), arboles de decisión, clúster y reglas de asociación, entender los factores de vulnerabilidad y la percepción de seguridad de esta población vulnerable. Para la obtención de los resultados, se analizan variables demográficas y de clasificación como el departamento, el género y la edad, y características que describen las condiciones de habitabilidad en la calle, tales como, los motivos para iniciar y continuar sin hogar, el consumo de sustancias psicoactivas, los tipos de maltratos a los que se ven expuestos (como insultos, amenazas, golpes y abuso policial), su contacto con la familia y las posibles ayudas que reciben de instituciones públicas o privadas. Desde los análisis realizados se concluye que condición de calle está principalmente ligada al consumo de sustancias psicoactivas, el gusto personal por vivir en la calle y los problemas familiares. Adicionalmente, fue posible segmentar a los habitantes de calle del país en 3 clústers caracterizados por factores disímiles entre sí, reflejando la necesidad de diseñar estrategias de política pública social diferenciadas y que contribuyan a la dignificación de sus condiciones vida, según necesidades específicas.Item Efecto antagónico de aislados nativos de laetisaria arvalis y trichoderma koningiopsis sobre cinco especies de hongos fitopatógenos del género rhizoctonia(2021) Tirado Jaraba, Raquel Del Carmen; Chavarro Mesa, EdissonLas plantas cultivadas, frecuentemente son afectadas por muchas enfermedades de interés agrícola, entre estas se destacan los virus, hongos, bacterias y plagas (insectos), siendo uno de los principales agentes fitopatógenos, los hongos que pueden estar presentes en los agrocultivos. Los microrganismos antagonistas contribuyen a la atenuación de los daños que causan las enfermedades, en los agroecosistemas donde existan condiciones para su desarrollo. Estos atributos, en conjunto con la capacidad de multiplicarse abundantemente, se encuentran entre los de mayor importancia para su selección como agentes de control biológico. En el presente estudio, con el objetivo de determinar la actividad antagónica de L. arvalis y T. koningiopsis, se establecieron enfrentamientos duales in vitro para los hongos fitopatógenos pertenecientes al género Rhizoctonia (R. oryzae, R. oryzae-sativae, R. solani AG-1 IF, R. solani AG-1 IA y R. zeae). Asimismo, se realizaron análisis descriptivos e inferenciales, correspondientes al Porcentaje de Crecimiento Radial Micelial Medio (PCRM). Se evidenció el incumplimiento de los supuestos de homocedasticidad y normalidad; implementándose métodos estadísticos robustos a través de ANOVA’s bidireccionales para cada uno de los diseños factoriales de cada biocontrolador; lo que nos permitió inferir que los hongos fitopatógenos al tener contacto con L. arvalis ejerce una acción de inhibición de crecimiento de R. solani AG1-IF y R. oryzae. Mientras que, el biocontrolador T. Koningiopsis no presentó acción biocontroladora sobre los fitopatógenos evaluados en el presente estudio.Item Distribución Harris-Kumaraswamy(2021) Osuna Vergara, Ignacio Segundo; Agamez Montalvo, Gualberto Segundo (asesor)En este trabajo, proponemos una nueva distribución de cuatro parámetros llamada Harris- Kumaraswamy (HK), que es una alternativa a las distribuciones conocidas en la literatura para modelar variables en diferentes campos cuyo soporte es el intervalo unitario estándar (0; 1). La distribución HK es obtenida como una generalización de la distribución Kumaraswamy utilizando el método propuesto en Aly and Benkherouf (2011). Varias propiedades matemáticas y estadísticas importantes del modelo propuesto son estudiadas e investigadas. El método de máxima verosimilitud es utilizado para estimar los parámetros del modelo. Evaluamos el desempeño del método de máxima verosimilitud mediante un estudio de simulación numérica. Finalmente, dos conjuntos de datos reales son utilizados para ilustrar la flexibilidad de la distribución HK en comparación con las distribuciones Kumaraswamy y Beta.Item Representación multidimensional de indicadores de preparación y reacción de los países del sur y el norte global a la pandemia del Covid-19(2021) Barco Llerena, Evelin; Medina Hernández, Edith Jhoana (directora)Comparar el nivel de preparación y reacción que han tenido los países del mundo para enfrentar la pandemia del COVID-19 implica analizar indicadores de desarrollo humano, salubridad, conectividad y letalidad. En este estudio se utiliza información publicada por el Programa de las Naciones Unidas para el Desarrollo (PNUD) y la Organización Mundial de la Salud (OMS), para observar el comportamiento de 148 países según si se consideran del sur (África, Latinoamérica y Asia-Oceanía) o del norte global, describiendo cómo se refleja la desigualdad social y sanitaria existente entre regiones, en las cifras de contagios y muertesa cierre de 2020. Se utiliza la técnica multivariante HJ-Biplot para representar de forma conjunta los países y las variables, las cuales son, en cuanto al nivel de preparación para hacer frente a la pandemia: índice de desarrollo humano, personal médico, personal de enfermería, camas de hospitales, gasto sanitario actual, suscripciones a telefonía móvil y a internet; y para medir el nivel de reacción al COVID-19: casos acumulados , muertes acumuladas y letalidad (muertes entre casos) desde la declaración de pandemia hasta el 31 de diciembre de 2020. También se utiliza clusterización jerárquica para observar por regiones los grupos de países que tienen comportamiento similar y Cross-correlación para identificar la asociación existente entre el grado de preparación y reacción de los países ante la crisis sanitaria. La principal conclusión en este estudio es que el nivel de preparación en términos de salubridad y desarrollo humano que tenían los países para hacer frente a la pandemia, no determina su éxito para reducir los contagios y la letalidad del COVID-19, porque éstos deben estar acompañados de estrategias gubernamentales de acción y reacción, que sean eficientes y rápidas. Los datos reflejan que las acciones tardías para frenar la propagación del virus se han transformado en pérdidas humanas.Item Obtención y validación de un modelo QSAR en inhibidores de la 5-lipoxigenasa(2021) Sánchez Marzan, Alan Orlando; Ariza Rúa, DaniloEl modelado cuantitativo de la relación estructura-actividad (QSAR) es un enfoque de diseño de fármacos in silico muy extendido que relaciona la estructura química de los compuestos con sus actividades biológicas. En el presente trabajo se construyen modelos QSAR en dos dimensiones (2D QSAR) con el uso de redes neuronales artificiales como clasificadores para la identificación de nuevas moléculas inhibidoras de la enzima 5-Lipoxigenasa. Este estudio ayudará a reducir el tiempo necesario en el proceso de descubrimiento de moléculas inhibidoras de la enzima 5-Lipoxigenasa que aporten al desarrollo de fármacos antiinflamatorios.Item Análisis multidimensional de indicadores ODS de educación e innovación en el mundo(2022) Álvarez Month, Julio Anderson; Medina Hernández, Edith Johana; De la Hoz Domínguez, Enrique JoséEn este trabajo se grado se analizan la educación y la innovación como condiciones del desarrollo sostenible. Se estudian las asociaciones observadas entre 8 indicadores pertenecientes a los Objetivos de Desarrollo Sostenible (ODS), según datos reportados por 109 países del mundo en el Informe de Sostenibilidad 2022. Se utiliza la técnica multivariante Statis Dual para interpretar las variaciones y covariaciones observadas según 3 vías de análisis: los indicadores, los países, y sus niveles de ingreso. Desde los análisis uni, bivariantes y multidimensionales realizados se concluye que en la medida en que se incrementa el nivel de ingreso de los países, se observan mejores puntajes en los indicadores ODS de educación e innovación, a pesar de que en todos los niveles se observan naciones con retos y oportunidades para favorecer las condiciones educativas de la población y los gastos públicos en educación y desarrollo.Item Análisis de indicadores de género en Latinoamérica (2005-2019) mediante las técnicas de representación multivariante Statis y Costatis(2021) Santamaría Campo, Susan Karola; Medina Hernández, Edith Johana (Asesor)El estudio de los indicadores de género permite analizar cómo hombres y mujeres contribuyen a las sociedades y las economías de las naciones. En el contexto latinoamericano, históricamente la mujer ha tenido menor representación frente a los hombres en los ámbitos políticos y económicos, por ello, en este trabajo de grado se analiza el comportamiento de 10 indicadores de género, en 16 países latinoamericanos. Estos datos se examinan desde cifras compiladas por el Observatorio de Igualdad de Género de la Comisión Económica para América Latina y el Caribe de las Naciones Unidas (CEPAL). A través de las técnicas multivariantes Statis y Costatis, se busca comprender la interacción entre los distintos indicadores, similitudes y diferencias entre países, y comparar cómo se observa la evolución en la situación de género de las mujeres entre los años 2005 y 2019. De acuerdo a los análisis realizados, se concluye que existen diferencias considerables entre los países de América Latina en cuanto al desarrollo de la autonomía económica y política de las mujeres. Panamá, Chile, Uruguay, Republica Dominicana, Costa Rica y Colombia reflejan ser las naciones donde las mujeres tienen más posibilidades de acceder a empleos de productividad alta. Por su parte, Bolivia, Nicaragua, México, Costa Rica, El Salvador, Uruguay y Ecuador, son los países que más han trabajado por buscar paridad de género en los cargos de poder político.Item Análisis de la participación ciudadana en Colombia desde datos de la encuesta de cultura política ECP-DANE 2019(2021) Zambrano Gandia, Deimer José; Medina Hernández, Edith Johana (Asesor)En esta investigación se analiza la participación ciudadana en Colombia desde datos de la Encuesta de Cultura Política (ECP-2019) publicada por el Departamento Administrativo Nacional (DANE) en el año 2020. Mediante análisis descriptivos y las técnicas de análisis multivariante, árboles de decisión y Análisis de Correspondencias Múltiples, se identifica bajo conocimiento y participación de los y las colombianas en mecanismos de participación tales como, la revocatoria de mandato, la iniciativa popular legislativa, el referendo, el plebiscito, la consulta popular y el cabildo abierto. Desde los resultados de este estudio, se observa que dos de los factores que condicionan la participación ciudadana en éstos y otros mecanismos de participación organizada, como las Juntas de Acción Comunal, se asocian a las percepciones de corrupción y el aumento de inseguridad en el país, los cuales generan problemas entre las comunidades. En términos de acciones de política pública, se concluye que es necesario seguir fortaleciendo los programas de participación ciudadana en el país, no solo para fomentar la garantía de derechos de participación, sino también a nivel de alfabetización y formación, para que más colombianos y colombianas busquen pertenecer a las organizaciones comunitarias organizadas y busquen el desarrollo sostenible de sus territorios.Item Análisis de acreditaciones y otros factores que influyen sobre los resultados de la prueba Saber Pro de los estudiantes colombianos de ingeniería año 2018(2022) Caraballo Villero, Jahyson; De la Hoz Domínguez, Enrique José; Domínguez, Andy; Sierra, DavidPara analizar los orígenes de buenos resultados en la prueba Saber Pro hay estudiar varias dimensiones de los estudiantes, como son los resultados de la prueba Saber 11, las condiciones socioeconómicas, los estados de la acreditación de la institución de educación superior donde se formó el estudiante, entre otros. Mediante las técnicas Análisis por componentes principales (PCA) y Regresión por mínimos cuadrados parciales (PLS), se tiene como objetivo identificar los factores que mayor incidencia tienen sobre los resultados de la prueba Saber Pro de los estudiantes de ingeniería en el año 2.018 en Colombia. También se usará la técnica regresión logística para determinar los módulos de la prueba Saber Pro que más se ven afectados por las acreditaciones de calidad institucional. Los resultados encontrados señalan que las acreditación de calidad de las instituciones educativas donde se formó el estudiante tienen un impacto positivo significativo sobre los resultados de la prueba Saber Pro en los módulos de lectura crítica, competencias ciudadanas e inglés, los resultados de la prueba Saber 11 tienen también un impacto positivo sobre cada módulo de la prueba, algunas condiciones socioeconómicas como el estrato, nivel educativo de los padres también inciden sobre los resultados de la prueba. Se encontró que los estudiantes que se forman en instituciones educativas de educación media no oficiales tienen una ligera ventaja sobre los demás, pero en cuanto a la educación superior los resultados muestran que esto no tiene incidencia. Las instituciones de educación superior que deseen elevar los resultados de sus pruebas Saber, deben implementar estrategias que les permitan identificar estos perfiles de estudiantes y desde muy temprano en las carreras poner en marcha planes de acompañamiento y fortalecimiento de habilidades para mejorar sus pruebas Saber Pro, sobre todo aquellas instituciones que no cuenten con acreditación de calidad.Item Factores sociodemográficos e institucionales asociados al rendimiento académico en la región caribe colombiana: un modelo multinivel(2021) Urueta Fernandez, Angel de Jesus; Vargas Ortiz, Luz Elena (asesor)Este trabajo se realizó con el objetivo de identificar y analizar los factores sociodemográficos e institucionales que influyen en el rendimiento académico en las competencias de matemáticas, lectura critica y ciencias naturales de los estudiantes de la región Caribe Colombiana en las pruebas ICFES SABER 11 calendario A entre los años 2016 al 2019, para ello primero se realizó un revisión bibliográfica para realizar la elección de factores, luego por medio de un modelo lineal multinivel se medirá el impacto de los diferentes factores asociados al rendimiento académico. Los resultados indican la existencia de brechas en el rendimiento académico dadas por el género, la naturaleza da la institución, la ubicación de la escuela, además del impacto negativo que poseen la jornada de la noche y sabatina, junto con el impacto positivo del nivel educativo de la madre en las competencias de matemáticas, lectura critica y ciencias naturales de los estudiantes de la regi´on Caribe Colombiana.Item Pronóstico de los estudiantes que aprobarían o no los cursos de matemáticas de primer semestre de los programas de ingeniería en la Universidad Tecnológica de Bolívar(2021) Abuchar Curi, Alfredo Miguel; De la Hoz Domínguez, Enrique José; Medina Hernández, Edith JohanaEn el presente trabajo se aplican técnicas de aprendizaje automático para predecir la aprobación o no de los cursos del área de matemáticas que se imparten en primer semestre en la facultad de ingeniería de la Universidad Tecnológica de Bolívar, a partir de los datos suministrados por los estudiantes en su proceso de admisión, como sexo, estrato social, programa académico, tipo de estudiante, estado civil, resultados en las diferentes áreas de las pruebas Saber 11, entre otras. Se realiza un análisis descriptivo de los datos, análisis de correspondencia múltiple (MCA), análisis de componentes principales (PCA) y un análisis de variables importantes para posteriormente realizar la fase de entrenamiento y evaluación de los modelos de aprendizaje automático aplicados. Los modelos aplicados fueron K-nearest Neighbors (KNN), General Linear Model en Red (GLMNET), Random Forest (RF), Support Vector Machine (SVM), Árbol de Decisión (DT), Neural Network (NEURALNET), GLMBOOST y GAMBOOST. Cada una de las bases de datos se dividió en dos: una del 70% para el entrenamiento y otra del 30% para la evaluación. En todos los casos se aplicó validación cruzada con 10 folds. Los mejores resultados se obtuvieron con el algoritmo de Neural Network: Multilayer Perceptron (NEURALNET).