3 research outputs found

    An Interval-based Multiobjective Approach to Feature Subset Selection Using Joint Modeling of Objectives and Variables

    Get PDF
    This paper studies feature subset selection in classification using a multiobjective estimation of distribution algorithm. We consider six functions, namely area under ROC curve, sensitivity, specificity, precision, F1 measure and Brier score, for evaluation of feature subsets and as the objectives of the problem. One of the characteristics of these objective functions is the existence of noise in their values that should be appropriately handled during optimization. Our proposed algorithm consists of two major techniques which are specially designed for the feature subset selection problem. The first one is a solution ranking method based on interval values to handle the noise in the objectives of this problem. The second one is a model estimation method for learning a joint probabilistic model of objectives and variables which is used to generate new solutions and advance through the search space. To simplify model estimation, l1 regularized regression is used to select a subset of problem variables before model learning. The proposed algorithm is compared with a well-known ranking method for interval-valued objectives and a standard multiobjective genetic algorithm. Particularly, the effects of the two new techniques are experimentally investigated. The experimental results show that the proposed algorithm is able to obtain comparable or better performance on the tested datasets

    A Survey on Evolutionary Computation Approaches to Feature Selection

    Get PDF
    Feature selection is an important task in data mining and machine learning to reduce the dimensionality of the data and increase the performance of an algorithm, such as a classification algorithm. However, feature selection is a challenging task due mainly to the large search space. A variety of methods have been applied to solve feature selection problems, where evolutionary computation (EC) techniques have recently gained much attention and shown some success. However, there are no comprehensive guidelines on the strengths and weaknesses of alternative approaches. This leads to a disjointed and fragmented field with ultimately lost opportunities for improving performance and successful applications. This paper presents a comprehensive survey of the state-of-the-art work on EC for feature selection, which identifies the contributions of these different algorithms. In addition, current issues and challenges are also discussed to identify promising areas for future research.</p

    Musikklassifikation mittels auditorischer Modelle zur Optimierung von HörgerÀten

    Get PDF
    In der Dissertation werden fĂŒr drei Musikklassifikationsprobleme - Toneinsatzzeiterkennung, TonhöhenschĂ€tzung und Instrumentenklassifikation - Verfahren entwickelt, die auf der Ausgabe eines Simulationsmodells des menschlichen Hörvorgangs (Ohrmodell) aufbauen. FĂŒr modifizierte Ohrmodelle, die eine HörschĂ€digung simulieren, kann mit Hilfe dieser Verfahren evaluiert werden, wie gut Musik differenziert wird. Ziel eines HörgerĂ€ts ist es, die Identifizierbarkeit von Musikeigenschaften zu steigern. Durch die VerknĂŒpfung eines HörgerĂ€tealgorithmus mit dem Ohrmodell und den Musikklassifikationsverfahren kann somit die GĂŒte des HörgerĂ€ts fĂŒr eine durch das Ohrmodell gegebene HörschĂ€digung bewertet werden. FĂŒr die Paramateroptimierung des HörgerĂ€tealgorithmus mit Hilfe der sequentiellen modellbasierten Optimierung (MBO) wird diese Bewertung als Kostenfunktion verwendet. FĂŒr die SchĂ€tzung der drei untersuchten Klassifikationsprobleme existieren bereits umfangreiche Forschungsarbeiten, die jedoch ĂŒblicherweise nicht die Ohrmodellausgabe sondern die akustische Wellenform als Grundlage nutzen. Daher werden zunĂ€chst die entwickelten Verfahren gegen diese Standardverfahren getestet. FĂŒr die Vergleichsexperimente wird ein statistischer Versuchsplan, dem ein Plackett-Burman-Design zu Grunde liegt, aufgestellt, um die untersuchten Musikdaten in einer strukturierten Form auszuwĂ€hlen. Es wird gezeigt, dass die Ohrmodellbasierte Merkmalsgrundlage keinen Nachteil darstellt, denn fĂŒr die TonhöhenschĂ€tzung und die Instrumentenklassifikation werden sogar die Ergebnisse der Standardverfahren ĂŒbertroffen. Lediglich bei der Einsatzzeiterkennung schneidet das entwickelte Verfahren etwas schlechter ab, fĂŒr das jedoch weitere Verbessserungsideen vorgeschlagen werden. Durch den Versuchsplan werden acht musikalische EinflussgrĂ¶ĂŸen berĂŒcksichtigt. FĂŒr diese wird evaluiert, wie sie sich auf die GĂŒte der Klassifikationsverfahren auswirken. Neben vielen erwarteten Ergebnissen, z.B. die grĂ¶ĂŸeren Fehlerraten bei einer Streicherbegleitung auf Grund der klanglichen NĂ€he zum Cello, kommen auch einige unerwartete Ergebnisse heraus. Beispielsweise sind höhere Tonhöhen und kĂŒrzere Töne vorteilhaft fĂŒr die Einsatzzeiterkennung, wohingegen tiefere Tonhöhen die Ergebnisse der Instrumentenerkennung verbessern. Der Versuchsplan wird auch fĂŒr einen Vergleich des normalen Ohrmodells (ohne HörschĂ€digung) mit drei Modellen, die unterschiedliche HörschĂ€digungen simulieren (Hearing Dummies), verwendet. FĂŒr all diese Modelle steigen die Fehlerraten der Musikklassifikationsverfahren in plausiblen StĂ€rken, die abhĂ€ngig von den HörschĂ€digungen sind. Schließlich wird die praktische Anwendbarkeit des Bewertungsverfahrens in einer leicht vereinfachten Form, die aus RechenzeitgrĂŒnden lediglich die Ergebnisse der Instrumentenerkennung berĂŒcksichtigt, fĂŒr die Optimierung eines HörgerĂ€tealgorithmus getestet. Dabei wird MBO verwendet, um das HörgerĂ€t optimal an eine starke HörschĂ€digung (Hearing Dummy 1) anzupassen. Durch das optimierte HörgerĂ€t wird die Fehlklassifikationsrate stark reduziert, und auch eine vergleichende Experteneinstellung wird geschlagen (27% ohne HörgerĂ€t, 19% mit HörgerĂ€t und Experteneinstellung, 14% mit optimiertem HörgerĂ€t). Wie die Auswertung des Versuchsplans zeigt, wird am stĂ€rksten die KlassifikationsgĂŒte fĂŒr MusikstĂŒcke mit Streicherbegleitung verbessert. Am Ende der Dissertation wird noch umfangreich diskutiert, welche Möglichkeiten es gibt, die Laufzeit von MBO fĂŒr das vorgestellte Optimierungsproblem zu reduzieren
    corecore