40 research outputs found

    Data Mining und seine betriebswirtschaftliche Relevanz

    Get PDF
    Mit dem Begriff "Data Mining" wird die Anwendung geeigneter Methoden zur Entdeckung von Strukturen und Beziehungen in großen Datenmengen umschrieben. Im Gegensatz zum Ansatz der induktiven Statistik stellen nicht im Vorfeld formulierte und zu überprüfende Hypothesen den Ausgangspunkt der Betrachtung dar; vielmehr sollen die in den Daten enthaltenen Informationen zur Theorieentwicklung genutzt werden. Damit wird mit dem Data Mining der eher modellgetriebenen Sichtweise der klassischen Statistik ein datengetriebener Ansatz vorangestellt, da auf Basis der in den Daten gefundenen Muster Hypothesen aufgestellt werden können, die dann mittels neuer Datensätze und konfirmatorischer Verfahren überprüft werden können. Darüber hinaus kann bereits das Entdecken von Strukturen ökonomisch wertvoll sein, was sich vor allem in betrieblichen Data-Mining-Anwendungen widerspiegelt

    Arbeitsbericht Nr. 2006-02, März 2006

    Get PDF
    Ilmenauer Beiträge zur Wirtschaftsinformatik Nr. 2006-02 / Technische Universität Ilmenau, Fakultät für Wirtschaftswissenschaften, Institut für Wirtschaftsinformatik, ISSN 1861-9223 ISBN 3-938940-05-

    Arbeitsbericht Nr. 2010-04, Dezember 2010

    Get PDF
    Ilmenauer Beiträge zur Wirtschaftsinformatik Nr. 2010-04 / Technische Universität Ilmenau, Fakultät für Wirtschaftswissenschaften, Institut für Wirtschaftsinformatik ISSN 1861-9223 ISBN 978-3-938940-28-

    Decision Trees for the Imputation of Categorical Data

    Get PDF
    Resolving the problem of missing data via imputation can theoretically be done by any prediction model. In the field of machine learning, a well known type of prediction model is a decision tree. However, the literature on how suitable a decision tree is for imputation is still scant to date. Therefore, the aim of this paper is to analyze the imputation quality of decision trees. Furthermore, we present a way to conduct a stochastic imputation using decision trees. We ran a simulation study to compare the deterministic and stochastic imputation approach using decision trees among each other and with other imputation methods. For this study, real datasets and various missing data settings are used. In addition, three different quality criteria are considered. The results of the study indicate that the choice of imputation method should be based on the intended analysis

    Arbeitsbericht Nr. 2011-05, Dezember 2011

    Get PDF
    Ilmenauer Beiträge zur Wirtschaftsinformatik Nr. 2011-05 / Technische Universität Ilmenau, Fakultät für Wirtschaftswissenschaften, Institut für Wirtschaftsinformatik ISSN 1861-9223 ISBN 978-3-938940-37-2Zusammenfassung: Hot-Deck-Verfahren sind spezielle, auf Imputationsklassen basierende Imputationsverfahren. Sie zeichnen sich dadurch aus, dass fehlende Daten durch vorhan-dene Werte der vorliegenden Datenmatrix imputiert werden. Das Objekt, das dabei die vorhandenen Daten zur Imputation liefert, wird als Spenderobjekt bezeichnet. Da die Er-setzung der fehlenden Daten eines Objekts durch die Ausprägungen eines ähnlichen Spen-derobjekts sinnvoller ist die Ersetzung durch die Ausprägungen eines beliebig ausgewählten Spenderobjekts, erfolgt dieser Verdopplungsprozess innerhalb der zuvor gebildeten Imputationsklassen. Durch diese grundsätzliche Vordopplungseigenschaft der Hot-Deck-Verfahren stellt sich damit das Problem, dass ein Spenderobjekt wiederholt zur Imputation ausgewählt werden kann. Im Extremfall könnten somit alle fehlenden Werte bei einem Merkmal durch ein und dieselbe Ausprägung eines einzigen Spenderobjekts ersetzt werden. Aus diesem Grund erfolgt bei einigen Varianten der Hot-Deck-Verfahren eine Begrenzung der Anzahl, wie häufig ein Objekt als Spenderobjekt verwendet werden darf. Damit stellt sich zwangsläufig die Frage, unter welchen Bedingungen eine derartige Begrenzung überhaupt sinnvoll ist. Im Rahmen dieser Arbeit wird daher eine umfangreiche Simulationsstudie zur Beantwortung dieser Frage durchgeführt. Dabei zeigt sich, dass es deutliche Unterschiede zwischen Hot-Deck-Imputationen gibt, bei denen die Spenderver-wendungshäufigkeit variiert wird. Darüber hinaus können auch einige Einflussfaktoren identifiziert werden, die für oder gegen eine Begrenzung der Spenderobjekte sprechen

    Arbeitsbericht Nr. 2006-05, November 2006

    Get PDF
    Ilmenauer Beiträge zur Wirtschaftsinformatik Nr. 2006-05 / Technische Universität Ilmenau, Fakultät für Wirtschaftswissenschaften, Institut für Wirtschaftsinformatik, ISSN 1861-9223 ISBN 3-938940-06-

    Arbeitsbericht Nr. 2015-02, August 2015

    Get PDF
    Entscheidungsbäume sind als Prognoseverfahren im Bereich des maschinellen Lernens verbreitet. Jedoch fehlt bisher eine Untersuchung, in wieweit sich die Algorithmen auch zur Imputation eignen. Dies ist insbesonders vor dem Hintergrund der verschiedenen Zielstellungen einer Imputation und einer Klassifikation relevant. So liegt bei einer Imputation häufig ein stärkerer Fokus auf der Struktur des Gesamtdatensatzes, wohingegen eine Klassifikation auf eine möglichst genaue Vorhersage einzelner Objekte abzielt. Neben den klassischen deterministischen Entscheidungsbäumen mit Majority Rule werden daher auch Entscheidungsbäume mit Class Probability Rule mit einer Zufallskomponente in die Untersuchung mit einbezogen. In einer Simulationsstudie, in der als Vergleichsverfahren zusätzlich eine Modus-Imputation und ein Random Hot Deck eingesetzt werden, zeigt sich, dass kein Verfahren in allen Fällen zum besten Ergebnis führt. So führt die Imputation mittels Entscheidungsbaum und Class Probability Rule meist zur geringsten Verzerrung der Häufigkeitsverteilung, jedoch stellt der Entscheidungsbaum mit Majority Rule meist die ursprünglichen Werte am besten wieder her. Welches Verfahren zur Imputation verwendet werden sollte, ist also abhängig vom Ziel der Imputation

    Marktforschung und Personalwesen

    No full text
    Marktforschung und Personalwesen : e. multivariate Studie von Einstellungskriterien ausgew. Unternehmen / Andreas Hilbert ; Udo Bankhofer. - In: Marketingprobleme / Daniel Baier ... (Hrsg.). - Regensburg : Roderer, 1995. - S. 81-90. - (Theorie und Forschung ; 352 : Wirtschaftswissenschaften ; 30

    Industrielles Standortmanagement

    No full text
    Industrielles Standortmanagement : Aufgabenbereiche, Entwicklungstendenzen u. problemorientierte Lösungsansätze. - Wiesbaden : Dt. Univ.-Verl., 2001. - XXV,271 S. - (Neue betriebswirtschaftliche Forschung ; 287). - Zugl.: Augsburg, Univ., Habil.-Schr

    Finanzmathematische Methoden in der Unternehmenspraxis

    No full text
    Finanzmathematische Methoden in der Unternehmenspraxis : e. empir. Unters. / U. Bankhofer ... - Augsburg, 1997. - IV, 46 S. - (Arbeitspapiere zur mathematischen Wirtschaftsforschung ; 151
    corecore