Abstract

Auxiliar de InvestigaciónLa clasificación de texto es una de las áreas de estudio de la disciplina del aprendizaje de máquina (en inglés Machine Learning) en donde se busca, posterior a una etapa de entrenamiento, predecir una categoría para datos de entrada que no hayan sido clasificados previamente. La longitud de los textos cortos, puede conllevar a una pérdida en la precisión de los resultados entregados por el proceso de clasificación de texto, ya que la cantidad de características aprovechables disminuye. Por lo tanto, se busca explorar una solución que permita realizar tareas de clasificación de textos cortos, con un nivel de precisión cercano al 80 %. Se desarrolló un componente de clasificación de textos cortos en el lenguaje de programación Python, haciendo uso del framework Flask el cual permite peticiones a través de un API y realiza la clasificación datasets que cumplan con el formato de entrada. Se probaron los resultados de este trabajo mediante el uso de publicaciones extraídas desde cuentas de Twitter, debido a la restricción sobre la longitud de sus publicaciones. La clasificación se realizó mediante el uso de algoritmos de aprendizaje supervisado, y en el mejor de los casos, la precisión obtenida fue cercana al 85 %.1. INTRODUCCIÓN 2. MARCO DE REFERENCIA 3. METODOLOGÍA 4. ESTADO DEL ARTE 5. DESARROLLO 6. RESULTADOS 7. CONCLUSIONES 8. TRABAJO FUTURO BIBLIOGRAFÍA ANEXOSPregradoIngeniero de Sistema

    Similar works

    Available Versions