1 research outputs found

    Predicci贸n de rendimiento y dificultad de problemas en programaci贸n genetica

    Get PDF
    La estimaci贸n de la dificultad de problemas es un tema abierto en Programaci贸n Gen茅tica (GP). El objetivo de este trabajo es generar modelosque puedan predecir el desempe帽o esperado de un clasificador basado en GP cuando este es aplicado a tareas de prueba. Los problemasde clasificaci贸n son descritos usando caracter铆sticas de un dominio espec铆fico, algunas de las cuales son propuestas en nuestro trabajo y estascaracter铆sticas son dadas como entrada a los modelos predictivos. Nos referimos a estos modelos como predictores de desempe帽o esperado(PEPs, por sus siglas en ingl茅s). Extendimos este enfoque usando un ensemble de predictores especializados (SPEPs, por sus siglas eningl茅s), dividiendo problemas de clasificaci贸n en grupos espec铆ficos y elegimos su correspondiente SPEP. Los predictores propuestos son entrenados usando problemas de clasificaci贸n sint茅ticos de 2D con conjunto de datos balanceados. Los modelos son entonces usados para predecir el desempe帽o de un clasificador de GP en problemas del mundo real antes no vistos los cuales son multidimensionales y desbalanceados. Ademas, este trabajo es el primero en proveer una predicci贸n de rendimiento para un clasificador de GP sobre datos de prueba, mientras en trabajos previos se han enfocado en predecir el rendimiento para datos de entrenamiento. Por lo tanto, planteados como un problema de regresi贸n simb贸lica son generados modelos predictivos exactos los cuales son resueltos con GP. Estos resultados son alcanzadosusando caracter铆sticas altamente descriptivas e incluyendo un paso de reducci贸n de dimensiones el cual simplifica el proceso de aprendizaje yprueba. El enfoque propuesto podr铆a ser extendido a otros algoritmos de clasificaci贸n y usarlo como base de un sistema experto de selecci贸nde algoritmos.The estimation of problem difficulty is an open issue in Genetic Programming(GP). The goal of this work is to generate models that predictthe expected performance of a GP-based classifier when it is applied toan unseen task. Classification problems are described using domainspecificfeatures, some of which are proposed in this work, and thesefeatures are given as input to the predictive models. These models arereferred to as predictors of expected performance (PEPs). We extendthis approach by using an ensemble of specialized predictors (SPEP),dividing classification problems into groups and choosing the correspondingSPEP. The proposed predictors are trained using 2D syntheticclassification problems with balanced datasets. The models are thenused to predict the performance of the GP classifier on unseen realworlddatasets that are multidimensional and imbalanced. This workis the first to provide a performance prediction of a GP system on testdata, while previous works focused on predicting training performance.Accurate predictive models are generated by posing a symbolic regressiontask and solving it with GP. These results are achieved by usinghighly descriptive features and including a dimensionality reductionstage that simplifies the learning and testing process. The proposed approachcould be extended to other classification algorithms and usedas the basis of an expert system for algorithm selection
    corecore