Publicación: Detección de anomalías con técnicas no supervisadas de aprendizaje automático: aplicación a los Registros Individuales de Prestación de Servicios de Salud (RIPS)
| dc.contributor.advisor | Domínguez Monterrosa, Andy Rafael | |
| dc.contributor.advisor | Patiño Vanegas, Alberto | |
| dc.contributor.author | Herrera Malambo, Diego Ernesto | spa |
| dc.coverage.spatial | Cartagena de Indias | |
| dc.date | 2025 | |
| dc.date.accessioned | 2025-08-16T12:15:13Z | |
| dc.date.issued | 2025 | spa |
| dc.description.abstract | El estudio se centra en el análisis de grandes volúmenes de datos sanitarios en Colombia, partiendo de los Registros Individuales de Prestación de Servicios de Salud (RIPS) como fuente oficial. Para mejorar la calidad y confiabilidad de estos datos, se han desarrollado dos productos clave: una metodología de validación que aprovecha los resultados de los métodos no supervisados de detección de anomalías y mide su impacto en clasificadores supervisados, y un proceso de minería de datos que limpia, consolida y estructura los RIPS en un dataset preparado para la implementación de modelos de machine learning. Con estos dos aportes se robustecen significativamente los procesos de análisis y auditoría de la información en salud. Los métodos de detección de anomalías no supervisados implementados en este trabajo corresponden a Local Outlier Factor (LOF), Isolation Forest (IF) y Autoencoder (AE). Cada uno de estos métodos proporciona una perspectiva diferente para detectar anomalías: LOF se fundamenta en la densidad local de los datos, reconociendo como anómalos aquellos puntos cuya densidad varía considerablemente de la de sus vecinos; IF emplea árboles de aislamiento para separar observaciones, consiguiendo identificar anomalías debido a su sencillez para ser aislados en las primeras fases del árbol y por último los Autoencoders que se basan en redes neuronales densas dise˜nadas para aprender eficazmente la reconstrucción de la entrada original. Se presenta también una metodología que permite validar la eficacia de las anomalías detectadas mediante métodos no supervisados fundamentándose en la premisa que los métodos de clasificación de aprendizaje automático tendrían un mejor desempeño en su tarea de clasificación si se realiza con datos sin anomalías, en este caso se implementan los siguientes algoritmos de clasificación (Regresión Logística (LR), Support Vector Classifier (SVC), K-Nearest Neighbors (KNN), Arbol de Decisión (DT), Random Forest (RF) y AdaBoost (AB)) comparando el desempeño de la métrica Area bajo la curva ROC primero antes de la detección y una segunda etapa posterior a la detección y eliminación de estos datos anómalos. Finalmente, se plantea un proceso de minería de datos orientado a la construcción de un dataset consolidado a partir de los Registros Individuales de Prestación de Servicios de Salud (RIPS), que permita implementar la metodología propuesta e identificar posibles registros anómalos según el enfoque definido. | spa |
| dc.description.degreelevel | Maestría | spa |
| dc.description.degreename | Magister en Estadística Aplicada y Ciencia de Datos | |
| dc.description.funder | Universidad Tecnológica de Bolívar | spa |
| dc.format.extent | 77 páginas | |
| dc.format.mimetype | application/pdf | |
| dc.identifier.citation | Diego Ernesto Herrera Malambo (2025). Detección de anomalías con técnicas no supervisadas de aprendizaje automático: Aplicación a los Registros Individuales de Prestación de Servicios de Salud (RIPS). Maestría en Estadística Aplicada y Ciencia de Datos. Universidad Tecnológica De Bolívar. Cartagena de Indias, Colombia, | spa |
| dc.identifier.instname | Universidad Tecnológica de Bolívar | spa |
| dc.identifier.local | 519.5 H565 | |
| dc.identifier.other | alma:57UTB_INST/bibs/99694431305731 | |
| dc.identifier.reponame | Repositorio UTB | |
| dc.identifier.uri | https://hdl.handle.net/20.500.12585/14150 | |
| dc.identifier.url | https://utb.alma.exlibrisgroup.com/discovery/delivery/57UTB_INST:57UTB_INST/1248516350005731 | |
| dc.language | spa | eng |
| dc.publisher | Universidad Tecnológica de Bolívar UTB | spa |
| dc.relation | alma:57UTB_INST/bibs/collections/8116946990005731 | |
| dc.relation.hasversion | info:eu-repo/semantics/publishedVersion | spa |
| dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
| dc.rights.coar | http://purl.org/coar/access_right/c_abf2 | |
| dc.rights.creativecommons | Atribución-NoComercial 4.0 Internacional | |
| dc.rights.license | Autorizo (autorizamos) a la Biblioteca de la Institución para que incluya una copia, indexe y divulgue en el Repositorio Institucional, la obra mencionada con el fin de facilitar los procesos de visibilidad e impacto de la misma, conforme a los derechos patrimoniales que me(nos) corresponde(n) y que incluyen: la reproducción, comunicación pública, distribución al público, transformación, de conformidad con la normatividad vigente sobre derechos de autor y derechos conexos referidos en art. 2, 12, 30 (modificado por el art 5 de la ley 1520/2012), y 72 de la ley 23 de de 1982, Ley 44 de 1993, art. 4 y 11 Decisión Andina 351 de 1993 art. 11, Decreto 460 de 1995, Circular No 06/2002 de la Dirección Nacional de Derechos de autor, art. 15 Ley 1520 de 2012, la Ley 1915 de 2018 y demás normas sobre la materia. Al respecto como Autor(es) manifestamos conocer que: La autorización es de carácter no exclusiva y limitada, esto implica que la licencia tiene una vigencia, que no es perpetua y que el autor puede publicar o difundir su obra en cualquier otro medio, así como llevar a cabo cualquier tipo de acción sobre el documento. La autorización tendrá una vigencia de cinco años a partir del momento de la inclusión de la obra en el repositorio, prorrogable indefinidamente por el tiempo de duración de los derechos patrimoniales del autor y podrá darse por terminada una vez el autor lo manifieste por escrito a la institución, con la salvedad de que la obra es difundida globalmente y cosechada por diferentes buscadores y/o repositorios en Internet lo que no garantiza que la obra pueda ser retirada de manera inmediata de otros sistemas de información en los que se haya indexado, diferentes al repositorio institucional de la Institución, de manera que el autor(res) tendrán que solicitar la retirada de su obra directamente a otros sistemas de información distintos al de la Institución si desea que su obra sea retirada de inmediato. La autorización de publicación comprende el formato original de la obra y todos los demás que se requiera para su publicación en el repositorio. Igualmente, la autorización permite a la institución el cambio de soporte de la obra con fines de preservación (impreso, electrónico, digital, Internet, intranet, o cualquier otro formato conocido o por conocer). La autorización es gratuita y se renuncia a recibir cualquier remuneración por los usos de la obra, de acuerdo con la licencia establecida en esta autorización. Al firmar esta autorización, se manifiesta que la obra es original y no existe en ella ninguna violación a los derechos de autor de terceros. En caso de que el trabajo haya sido financiado por terceros el o los autores asumen la responsabilidad del cumplimiento de los acuerdos establecidos sobre los derechos patrimoniales de la obra con dicho tercero. Frente a cualquier reclamación por terceros, el o los autores serán responsables, en ningún caso la responsabilidad será asumida por la institución. Con la autorización, la institución puede difundir la obra en índices, buscadores y otros sistemas de información que favorezcan su visibilidad. | |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
| dc.subject.proposal | Aprendizaje no supervisado | |
| dc.subject.proposal | Detección de Anomalías | |
| dc.subject.proposal | Estadística aplicada | |
| dc.subject.proposal | Minería de datos | |
| dc.subject.proposal | Aprendizaje automático | |
| dc.subject.proposal | Algoritmos de clasificación (Estadística) | |
| dc.subject.proposal | Redes neuronales artificiales | |
| dc.title | Detección de anomalías con técnicas no supervisadas de aprendizaje automático: aplicación a los Registros Individuales de Prestación de Servicios de Salud (RIPS) | spa |
| dc.type.coar | http://purl.org/coar/resource_type/c_bdcc | |
| dc.type.coarversion | http://purl.org/coar/version/c_970fb48d4fbd8a85 | spa |
| dc.type.driver | info:eu-repo/semantics/masterThesis | |
| dcterms.audience | Público general | spa |
| dspace.entity.type | Publication | |
| relation.isDirectorOfPublication | 6e37b1f5-799a-4517-be2e-d98b93abe61d | |
| relation.isDirectorOfPublication | 276cfc78-a984-49e2-a962-a3ed47c35f62 | |
| relation.isDirectorOfPublication.latestForDiscovery | 6e37b1f5-799a-4517-be2e-d98b93abe61d |