Universidad Nacional Mayor de San Marcos, Facultad de Ingeniería de Sistemas e Informática
Doi
Abstract
La investigación se centró en identificar el modelo de predicción más adecuado de machine learning para casos de anemia en el Perú, seleccionando específicamente a la provincia del Cusco como área de estudio. Los datos utilizados provienen de la plataforma oficial de Datos Abiertos del Perú, relacionados con la Anemia en esta región. La metodología implementada fue SEMMA, permitiendo desarrollar cada una de sus fases características. Se evaluaron cinco modelos de machine learning: Árbol De Decisión, Redes Neuronales, Naive Bayes, Bootstrap y Regresión Múltiple, considerando métricas como Accuracy, F1-Score, Recall y Support. Los resultados de precisión obtenidos fueron: Árbol de Decisión (0.8549), Redes Neuronales (0.9251), Naive Bayes (0.3691), Bootstrap (0.9975) y Regresión Múltiple (1.00). Se concluyó que la Regresión Múltiple es la más precisa, sin embargo, presentó limitaciones en métricas como el F1-Score, posicionando a las Redes Neuronales como las más efectivas al considerar las cuatro métricas evaluadas.The research focused on identifying the most appropriate Machine Learning prediction model for Anemia cases in Peru, specifically selecting the province of Cusco as the study area. The data used came from the official platform of Open Data of Peru, related to Anemia in this region. The methodology implemented was SEMMA, allowing the development of each of its characteristic phases. Five Machine Learning models were evaluated: Decision Tree, Neural Networks, Naive Bayes, Bootstrap and Multiple Regression, considering metrics such as Accuracy, F1-Score, Recall and Support. The accuracy results obtained were: Decision Tree (0.8549), Neural Networks (0.9251), Naive Bayes (0.3691), Bootstrap (0.9975) and Multiple Regression (1.00). It was concluded that Multiple Regression is the most accurate, however, it presented limitations in metrics such as F1-Score, positioning Neural Networks as the most effective when considering the four metrics evaluated
Is data on this page outdated, violates copyrights or anything else? Report the problem now and we will take corresponding actions after reviewing your request.