2 research outputs found

    Contributions to comprehensible classification

    Get PDF
    xxx, 240 p.La tesis doctoral descrita en esta memoria ha contribuido a la mejora de dos tipos de algoritmos declasificaci贸n comprensibles: algoritmos de \'arboles de decisi贸n consolidados y algoritmos de inducci贸nde reglas tipo PART.En cuanto a las contribuciones a la consolidaci贸n de algoritmos de 谩rboles de decisi贸n, se hapropuesto una nueva estrategia de remuestreo que ajusta el n煤mero de submuestras para permitir cambiarla distribuci贸n de clases en las submuestras sin perder informaci贸n. Utilizando esta estrategia, la versi贸nconsolidada de C4.5 (CTC) obtiene mejores resultados que un amplio conjunto de algoritmoscomprensibles basados en algoritmos gen茅ticos y cl谩sicos. Tres nuevos algoritmos han sido consolidados:una variante de CHAID (CHAID*) y las versiones Probability Estimation Tree de C4.5 y CHAID* (C4.4y CHAIC). Todos los algoritmos consolidados obtienen mejores resultados que sus algoritmos de\'arboles de decisi贸n base, con tres algoritmos consolidados clasific谩ndose entre los cuatro mejores en unacomparativa. Finalmente, se ha analizado el efecto de la poda en algoritmos simples y consolidados de\'arboles de decisi贸n, y se ha concluido que la estrategia de poda propuesta en esta tesis es la que obtiene mejores resultados.En cuanto a las contribuciones a algoritmos tipo PART de inducci贸n de reglas, una primerapropuesta cambia varios aspectos de como PART genera \'arboles parciales y extrae reglas de estos, locual resulta en clasificadores con mejor capacidad de generalizar y menor complejidad estructuralcomparando con los generados por PART. Una segunda propuesta utiliza \'arboles completamentedesarrollados, en vez de parcialmente desarrollados, y genera conjuntos de reglas que obtienen a煤nmejores resultados de clasificaci贸n y una complejidad estructural menor. Estas dos nuevas propuestas y elalgoritmo PART original han sido complementadas con variantes basadas en CHAID* para observar siestos beneficios pueden ser trasladados a otros algoritmos de \'arboles de decisi贸n y se ha observado, dehecho, que los algoritmos tipo PART basados en CHAID* tambi茅n crean clasificadores m谩s simples ycon mejor capacidad de clasificar que CHAID

    Contributions to comprehensible classification

    Get PDF
    xxx, 240 p.La tesis doctoral descrita en esta memoria ha contribuido a la mejora de dos tipos de algoritmos declasificaci贸n comprensibles: algoritmos de \'arboles de decisi贸n consolidados y algoritmos de inducci贸nde reglas tipo PART.En cuanto a las contribuciones a la consolidaci贸n de algoritmos de 谩rboles de decisi贸n, se hapropuesto una nueva estrategia de remuestreo que ajusta el n煤mero de submuestras para permitir cambiarla distribuci贸n de clases en las submuestras sin perder informaci贸n. Utilizando esta estrategia, la versi贸nconsolidada de C4.5 (CTC) obtiene mejores resultados que un amplio conjunto de algoritmoscomprensibles basados en algoritmos gen茅ticos y cl谩sicos. Tres nuevos algoritmos han sido consolidados:una variante de CHAID (CHAID*) y las versiones Probability Estimation Tree de C4.5 y CHAID* (C4.4y CHAIC). Todos los algoritmos consolidados obtienen mejores resultados que sus algoritmos de\'arboles de decisi贸n base, con tres algoritmos consolidados clasific谩ndose entre los cuatro mejores en unacomparativa. Finalmente, se ha analizado el efecto de la poda en algoritmos simples y consolidados de\'arboles de decisi贸n, y se ha concluido que la estrategia de poda propuesta en esta tesis es la que obtiene mejores resultados.En cuanto a las contribuciones a algoritmos tipo PART de inducci贸n de reglas, una primerapropuesta cambia varios aspectos de como PART genera \'arboles parciales y extrae reglas de estos, locual resulta en clasificadores con mejor capacidad de generalizar y menor complejidad estructuralcomparando con los generados por PART. Una segunda propuesta utiliza \'arboles completamentedesarrollados, en vez de parcialmente desarrollados, y genera conjuntos de reglas que obtienen a煤nmejores resultados de clasificaci贸n y una complejidad estructural menor. Estas dos nuevas propuestas y elalgoritmo PART original han sido complementadas con variantes basadas en CHAID* para observar siestos beneficios pueden ser trasladados a otros algoritmos de \'arboles de decisi贸n y se ha observado, dehecho, que los algoritmos tipo PART basados en CHAID* tambi茅n crean clasificadores m谩s simples ycon mejor capacidad de clasificar que CHAID
    corecore