2,200 research outputs found

    Vergleich von Strategien zum Clustern von Daten mit fehlenden Werten

    Get PDF
    Die klassischen Methoden zur Clusteranalyse wurden entwickelt, um auf vollständigen Daten Analysen durchzuführen. Oft fehlen aber in Daten einzelne Werte - systematisch oder unsystematisch -, z.B. infolge der Probleme bei der Datenerfassung, Datenübertragung, Datenbereinigung oder weil Daten aus unterschiedlichen Quellen stammen. Demzufolge können die traditionellen Clusteringmethoden zur Analyse solcher Daten nicht ohne weiteres angewendet werden. Im Rahmen dieses Beitrags werden unterschiedliche Strategien zum Umgang mit fehlenden Werten in Daten für das Clusteringproblem vorgestellt, analysiert und miteinander verglichen. Dabei wird das besondere Augenmerk auf die Untersuchung der Leistungsfähigkeit dieser Verfahren in Abhängigkeit von den Ausfallmechanismen, die den fehlenden Werten zugrundeliegen, und von dem Anteil fehlender Werte in Daten gelegt

    Konzept zur datengetriebenen Analyse und Modellierung des preisbeeinflussten Verbrauchsverhaltens

    Get PDF
    Der verstärkte Ausbau von Erneuerbare-Energien-Anlagen in Deutschland führt dazu, dass der Anteil der erneuerbaren Energien am gesamten Bruttostromverbrauch im Jahr 2016 bei ca. 32% lag. Die Erzeugungscharakteristik von Photovoltaik- und Windkraftanlagen macht jedoch nachfrage- und erzeugungsseitige Anpassungen im deutschen Elektrizitätsmarkt notwendig. Im Energiesystem der Zukunft (Smart Grid) wird die Bereitstellung von lastseitigen Flexibilitäten eine bedeutende Rolle einnehmen. Die Veränderung der Verbraucherlast durch Preisanreize steht dabei ausdrücklich nicht in Konkurrenz zum verstärkten Ausbau von Energiespeichern, Energieübertragungs- und -verteilnetzen. Die Verbraucherbeeinflussung mithilfe von Steuer- (Demand Side Management, DSM) und Preissignalen (Demand Response, DR) setzt allerdings voraus, dass die Auswirkungen von Preissignalen für Energieverbraucher auf deren Verbrauchsverhalten untersucht, mathematisch modelliert und validiert werden. Die vorliegende Doktorarbeit beschäftigt sich aus diesem Grund mit der datengetriebenen Analyse und Modellierung des Verbrauchsverhaltens als Reaktion auf variable Stromtarife. Dazu wurde ein Gesamtkonzept entwickelt, das aus verschiedenen Vorverarbeitungs-, Analyse- und Modellierungsmethoden besteht. Das Konzept behandelt die gesamte Prozesskette von der Erfassung der Smart-Meter-Rohdaten bis hin zur Analyse und Modellierung des preisbeeinflussten Verbrauchsverhaltens. Das Zeitreihen-Clustering als wichtiger Bestandteil des neuen Konzeptes erlaubt, Aussagen über saisonale, wochentagsbedingte, tarifbedingte Unterschiede für eine Demand-Response-Maßnahme treffen zu können. Des Weiteren erlaubt das neue Konzept, dass haushaltsindividuelle Unterschiede in der Verbrauchsreaktion (Responder-, Semi-Responder, Non-Responder-Haushalte) identifiziert werden können. Zudem wurde eine neue Demand-Response-Modellklasse (Virtuelle-Speicher-Modelle) entwickelt, deren Modelle aus einem System von Differenzengleichungen bestehen und das Verbrauchsverhalten von Haushaltsstromkunden als Reaktion auf verschiedene Preissignale beschreiben

    Ein Framework zur Analyse komplexer Produktportfolios mittels Machine Learning

    Get PDF
    Die Nachfrage der Kunden nach individualisierten Produkten, die Globalisierung, neue Konsummuster sowie kürzere Produktlebenszyklen führen dazu, dass Unternehmen immer mehr Varianten anbieten. Aufgrund der Arbeitsteilung und der unterschiedlichen Perspektiven können einzelne Entwickler die Komplexität des Produktportfolios nicht durchdringen. Dennoch sind die heutigen Verfahren im Produktportfolio- und Variantenmanagement geprägt durch manuelle und erfahrungsbasierte Aktivitäten. Eine systematische Analyse und Optimierung des Produktportfolios sind damit nicht möglich. Unternehmen benötigen stattdessen intelligente Lösungen, welche das gespeicherte Wissen in Daten nutzen und einsetzen, um Entscheidungen über Innovation, Differenzierung und Elimination von Produktvarianten zu unterstützen. Zielstellung dieses Forschungsvorhabens ist die Entwicklung eines Frameworks zur Analyse komplexer Produktportfolios mittels Machine Learning. Machine Learning ermöglicht es, Wissen aus Daten unterschiedlicher Lebenszyklusphasen einer Produktvariante automatisiert zu generieren und zur Unterstützung des Produktportfolio- und Variantenmanagements einzusetzen. Für die Unterstützung der Entscheidungen über Produktvarianten ist Wissen über deren Abhängigkeiten und Beziehungen sowie die Eigenschaften der einzelnen Elemente erforderlich. Dadurch soll ein Beitrag zur besseren Handhabung komplexer Produktportfolios geleistet werden. Das Framework zur Analyse komplexer Produktportfolios mittels Machine Learning besteht aus drei Bausteinen, die das zentrale Ergebnis dieser Arbeit darstellen. Zuerst wird in Baustein 1 auf die Wissensbedarfe bei der Analyse und Anpassung komplexer Produktportfolios eingegangen. Anschließend werden in Baustein 2 die Daten, welche für Entscheidungen und somit für die Wissensgenerierung im Produktportfolio- und Variantenmanagement erforderlich sind, beschrieben und charakterisiert. Abschließend findet in Baustein 3 die Datenvorbereitung und die Implementierung der Machine Learning Verfahren statt. Es wird auf unterschiedliche Verfahren eingegangen und eine Unterstützung bei der Auswahl und Evaluation der Algorithmen sowie die Möglichkeiten zum Einsatz des generierten Wissens für die Analyse komplexer Produktportfolios aufgezeigt. Das Framework wird in einer Fallstudie bei einem Industriepartner aus der Nutzfahrzeugbranche mit einem besonders komplexen Produktportfolio angewendet. Dabei werden die drei Anwendungsfälle Prognose von „marktspezifischen und technischen Eigenschaften der Produktvarianten“, Ermittlung von „Ähnlichkeiten von Produktvarianten“ und Identifikation von „Korrelationen zwischen Merkmalsausprägungen“ mit realen Daten des Industriepartners umgesetzt. Das Framework sowie die in der Fallstudie beim Industriepartner erzielten Ergebnisse werden anschließend Experten im Produktportfolio- und Variantenmanagement vorgestellt. Diese bewerten die Ergebnisse hinsichtlich der funktionalen Eigenschaften sowie dem Mehrwert aus Sicht der Forschung und industriellen Praxis anhand zuvor definierter Kriterien.:1 Einführung 1.1 Motivation 1.2 Komplexe Produktportfolios: Eine Industrieperspektive 1.3 Zielsetzung und Forschungsfragen 1.4 Aufbau der Arbeit 2 Grundlagen zur Analyse von Produktportfolios mittels Machine Learning 2.1 Komplexe Produktportfolios 2.1.1 Terminologie komplexer Produktportfolios 2.1.2 Strukturierung komplexer Produktportfolios 2.1.3 Analyse und Anpassung komplexer Produktportfolios 2.1.4 Zusammenfassung: Komplexe Produktportfolios 2.2 Machine Learning 2.2.1 Machine Learning als Teil der künstlichen Intelligenz 2.2.2 Terminologie Machine Learning 2.2.3 Wissensgenerierung mit Machine Learning 2.2.4 Datenanalyseprozess 2.2.5 Machine Learning Verfahren und Algorithmen 2.2.6 Zusammenfassung: Machine Learning 3 Ansätze zur Analyse von Produktportfolios mittels Machine Learning 3.1 Kriterien zur Bewertung bestehender Ansätze 3.2 Bestehende Ansätze aus der Literatur 3.2.1 Einsatz überwachter Lernverfahren 3.2.2 Einsatz unüberwachter Lernverfahren 3.2.3 Einsatz kombinierter Lernverfahren 3.3 Resultierender Forschungsbedarf 4 Forschungsvorgehen 4.1 Design Research Methodology (DRM) 4.2 Vorgehen und Methodeneinsatz 4.3 Kriterien für die Entwicklung des Frameworks 4.4 Schlussfolgerungen zum Forschungsvorgehen 5 Framework zur Analyse komplexer Produktportfolios 5.1 Übersicht über das Framework 5.2 Baustein 1: Wissensbedarfe zur Analyse komplexer Produktportfolios 5.2.1 Informationssuche 5.2.2 Formulierung von Alternativen 5.2.3 Prognose 5.2.4 Kriterien zur Auswahl der Wissensbedarfe 5.3 Baustein 2: Datenbasierte Beschreibung komplexer Produktportfolios 5.3.1 Produktdatenmodell 5.3.2 Vertriebsdaten 5.3.3 Nutzungsdaten 5.4 Baustein 3: Systematische Generierung und Einsatz von Wissen 5.4.1 Baustein 3.0: Vorbereitung von Produktportfoliodaten 5.4.2 Baustein 3.1: Regressionsanalyse 5.4.3 Baustein 3.2: Klassifikationsanalyse 5.4.4 Baustein 3.3: Clusteranalyse 5.4.5 Baustein 3.4: Assoziationsanalyse 5.5 Anwendung des Frameworks 5.6 Schlussfolgerung zum Framework 6 Validierung des Frameworks 6.1 Konzept der Validierung 6.2 Baustein 1: Wissensbedarfe zur Analyse komplexer Produktportfolios 6.3 Baustein 2: Datenbasierte Beschreibung komplexer Produktportfolios 6.4 Baustein 3: Systematische Generierung und Einsatz von Wissen 6.4.1 Marktspezifische und technische Produkteigenschaften 6.4.2 Ähnlichkeiten von Produktvarianten 6.4.3 Korrelationen zwischen Merkmalsausprägungen 6.5 Erfolgsvalidierung mit einer Expertenbefragung 6.6 Schlussfolgerung zur Validierung 7 Diskussion 7.1 Nutzen und Einschränkungen 7.2 Ergebnisbeitrag für die Forschung 7.3 Ergebnisbeitrag für die Industrie 8 Zusammenfassung und Ausblick 8.1 Zusammenfassung 8.2 Ausblick 9 Literaturverzeichnis 10 Abbildungsverzeichnis 11 Tabellenverzeichnis Anhang A-

    Statistische Analyse und Modellierung von Clusterphänomenen bei Signalproteinen in der Plasmamembran

    Get PDF
    In der vorliegenden Arbeit wurde sich mit Clusterphänomenen von Signalproteinen beschäftigt. Diese Proteine sind dabei in der Plasmamembran lokalisiert und für die Kommunikation und den Stoffaustausch der Zelle zuständig. Die Daten wurden mit Hilfe von Fluoreszenzmikroskopie am Max-Planck-Institut für molekulare Physiologie in Dortmund in der Arbeitsgruppe von Dr. Peter J. Verveer erhoben. Um die Clusterphänomene zu untersuchen, können unterschiedliche Blickwinkel und Fragestellungen betrachtet werden. In dieser Arbeit wurde eine zeitliche, eine räumliche und eine zeitlich-räumliche Analyse entsprechender Daten vorgenommen. In der zeitlichen Analyse wurden Proteinzeitreihen untersucht. Die Proteinzeitreihe ergibt sich aus der Messung der Lichtintensität eines Spots, d.h. eines Proteinclusters, über die Zeit hinweg. Das Ziel ist hier die Segmentierung eben dieser Proteinzeitreihe. Hier wurde ein Bayessches hierarchisches Modell zur Segmentierung genutzt. Dieses lieferte dabei sinnvolle Ergebnisse, wobei jedoch zu beachten war, dass die Anzahl an Segmenten stets als fest angesehen wurde. Um diese Einschränkung aufzuheben, wurde ein Reversible Jump Schritt in das Modell aufgenommen. Mit dieser Erweiterung konnten nun sinnvolle Ergebnisse mit einer höheren Flexibilität für den Anwender erreicht werden. In der räumlichen Analyse wurde ein Pixelbild aus einer Messung einer lebenden Zelle mit Hilfe von TIRF-Mikroskopie untersucht. Ziel war hier die räumliche Clusterstruktur zu untersuchen, wobei sich auf den Anteil an Proteinen in Clustern beschränkt wurde. Dafür wurden zunächst unterschiedliche Methoden auf einer simulierten Region untersucht. Mit Hilfe dieser Ergebnisse konnte ein Anwendungsschema zur effizienten Kombination eben dieser Methoden aufgestellt werden. Dieses wurde abschließend auf einen experimentellen Datensatz sowie auf eine Dual Colour Simulation angewendet. Es zeigte sich, dass durch das Vorgehen des Schemas die Parameterwahl für einige Methoden vereinfacht wurde und sinnvolle Ergebnisse berechnet werden konnten. Abschließend wurden in der räumlich-zeitlichen Analyse Proteintracks untersucht. Diese Proteintracks geben den Weg eines Proteins in der Zellmembran über die Zeit hinweg an. Diese Messung wurde simultan für zwei Proteinarten durchgeführt, sodass hier erneut der Dual Colour Fall vorliegt. Ziel war die Bestimmung von Zusammenhängen zweier Proteintracks unterschiedlicher Proteinarten. Um den Zusammenhang bestmöglich berechnen zu können, wurde zunächst diskutiert, welche Eigenschaften einen hohen Zusammenhang repräsentieren. Anschließend wurden diese Eigenschaften zu einem Zusammenhangsmaß zusammen gefügt. Mit diesem Maß wurden zum einen ein simuliertes Beispiel und zum anderen experimentelle Daten analysiert. Es zeigte sich, dass Abhängigkeitsstrukturen durch das Maß gut widergespiegelt wurden und mit Hilfe von Cutoffs eine Auswahl entsprechender Proteintracks erfolgen konnte. Durch diese Auswahl konnten weiter interessante Regionen sowie Cluster identifiziert werden

    Zur Rekonstruktion einer Typologie jugendlichen Medienhandelns gemäß dem Leitbild der Triangulation

    Get PDF
    Die im Folgenden dargestellten Ergebnisse sind im Rahmen des von der DFG geförderten Forschungsprojekts „Eine Untersuchung zum Mediennutzungsverhalten 12- bis 20-Jähriger und zur Entwicklung von Medienkompetenz im Jugendalter“ entstanden, das gemeinsam von Klaus Peter Treumann, Uwe Sander und Dorothee Meister geleitet wird. Das Forschungsprojekt untersucht das Medienhandeln Jugendlicher sowohl hinsichtlich Neuer als auch alter Medien. Zum einen fragen wir dabei nach den Ausprägungen von Medienkompetenz in verschiedenen Dimensionen und zum anderen konzentrieren wir uns auf die Entwicklung einer empirisch fundierten Typologie jugendlichen Medienhandelns. Methodologisch ist die Untersuchung an dem Leitbild der Triangulation orientiert und kombiniert qualitative und quantitative Zugänge zum Forschungsfeld in Form von Gruppendiskussionen, leitfadengestützten Einzelinterviews und einer Repräsentativerhebung

    Relevante mathematische Kompetenzen von Ingenieurstudierenden im ersten Studienjahr - Ergebnisse einer empirischen Untersuchung

    Get PDF
    Fehlende Kompetenzen in Mathematik und Naturwissenschaften werden von Studierenden als ein Grund für den Studienabbruch in Ingenieurwissenschaften angegeben (Heublein et al., 2017). Welche Kompetenzen für Studierende zu Beginn des Ingenieurstudiums relevant sind, ist jedoch bisher wenig empirisch untersucht. Das Ziel der vorliegenden Studie ist, relevante mathematische Kompetenzen von Ingenieurstudierenden zu analysieren und dabei sowohl Wissensbestände als auch die Anwendung von Wissen und die Zusammenhänge zwischen beiden Bereichen zu berücksichtigen. Dazu wurde eine Studie im Mixed-Methods Design entwickelt. In dieser werden die Studierenden hinsichtlich ihrer Dispositionen in Mathematik und Physik zu Beginn des Studiums und am Ende des ersten Studienjahres mit quantitativen Methoden getestet. Zu diesen beiden und einem weiteren Zeitpunkt am Ende des ersten Semesters wurden zudem die situationsspezifischen Fähigkeiten bei der Bearbeitung von Mathematik- und Physikaufgaben mit Hilfe eines theoretischen Rahmens zum mathematischen Problemlösen mit qualitativen Methoden untersucht. Dieser Theorierahmen umfasste für die Mathematikaufgaben die Aspekte Heurismen (Bruder & Collet, 2011; Schoenfeld, 1980) und Problemlösephasen (Polya, 1957) sowie das Modell der Epistemic Games (Tuminaro, 2004) zur Analyse der Bearbeitung von Physikaufgaben. Die Ergebnisse zeigen Zusammenhänge zwischen mathematischen und physikali-schen Dispositionen. Zusätzlich wird die Bedeutung von Aspekten des Problemlösens deutlich, um die Prozesse bei den Bearbeitungen von Mathematik und Physikaufgaben im ersten Studienjahr zu analysieren. Auf Grundlage der qualitativen Beschreibungen konnten Cluster von Fällen von Studierenden gebildet werden. Mit Hilfe dieser Cluster zeigen sich Zusammenhänge zwischen den Dispositionen und situationsspezifischen Fähigkeiten bei den besonders leistungsstarken und leistungsschwachen Studierenden.Missing competences in mathematics and sciences are cited by students as a reason for the drop-out in engineering sciences (Heublein et al., 2017). However, the competences that are relevant for students at the beginning of their engineering studies have so far not been investigated in an empirical way. The aim of this study is to analyse relevant mathematical competences of engineering students, taking into account both knowledge and the application of knowledge and the interrelationships between the two. A study in mixed method design was developed for this purpose. In this study, students are tested with regard to their dispositions in mathematics and physics at the beginning of their studies and at the end of the first year of their studies using quantitative methods. At these two points in time and a further time at the end of the first semester, the situation-specific skills in processing math and physics tasks were examined with the help of a theoretical framework for solving mathematical problems, using qualitative methods. This theoretical framework included for the mathematical tasks the aspects heuristics (Bruder & Collet, 2011; Schoenfeld, 1980) and problem solving phases (Polya, 1957) as well as the model of Epistemic Games (Tuminaro, 2004) for the analysis of the processing of physical tasks. The results show interrelationships between mathematical and physical dispositions. In addition, it became clear that there is a need of problem solving aspects in order to analyse the processes involved in the working on maths and physics tasks in the first year of studies. Based on the qualitative descriptions, clusters of student cases could be formed. These clusters show the interrelationships between dispositions and situation-specific skills of particularly high-performing and underperforming students

    Empirische Untersuchung der Wettbewerbsrelevanz von Business Intelligence-Konfigurationen auf der Basis des Resource-based View

    Get PDF
    Business Intelligence Systeme werden seit einigen Jahren weit verbreitet in Unternehmen eingesetzt. Trotz weiter Verbreitung von BI-Systemen fehlt es an einer umfassenden Evaluation dieser Systemkategorie, die zur Einschätzung der Leistungsfähigkeit aber auch zur weiteren Verbesserung in der Zukunft beitragen könnte. Als ein Beitrag zur Evaluation wird in vorliegender Arbeit die Frage gestellt, ob Unternehmen durch den Einsatz von BI-Systemen einen nachhaltigen Wettbewerbsvorteil erzielen können. Als Ergebnis kann festgestellt werden, dass der Einsatz von BI-Systemen in Unternehmen zu nachhaltigen Wettbewerbsvorteilen führt - allerdings nur für Unternehmen, die über eine wettbewerbsrelevante BI-Konfiguration im Sinne des ressourcenbasierten Ansatzes verfügen und einem der beiden ermittelten wettbewerbsrelevanten Cluster zugeordnet werden kann. Damit ergibt sich als Handlungsempfehlung für Unternehmen die Überprüfung der Strategie, Implementierung und Betrieb ihrer BI sowie dem umgebenden Kontext und den resultierenden Folgen, um im Anschluss mögliche identifizierte Lücken zu einem der beiden wettbewerbsrelevanten Cluster schließen zu können

    Empirische Untersuchung der Wettbewerbsrelevanz von Business Intelligence-Konfigurationen auf der Basis des Resource-based View

    Get PDF
    Business Intelligence Systeme werden seit einigen Jahren weit verbreitet in Unternehmen eingesetzt. Trotz weiter Verbreitung von BI-Systemen fehlt es an einer umfassenden Evaluation dieser Systemkategorie, die zur Einschätzung der Leistungsfähigkeit aber auch zur weiteren Verbesserung in der Zukunft beitragen könnte. Als ein Beitrag zur Evaluation wird in vorliegender Arbeit die Frage gestellt, ob Unternehmen durch den Einsatz von BI-Systemen einen nachhaltigen Wettbewerbsvorteil erzielen können. Als Ergebnis kann festgestellt werden, dass der Einsatz von BI-Systemen in Unternehmen zu nachhaltigen Wettbewerbsvorteilen führt - allerdings nur für Unternehmen, die über eine wettbewerbsrelevante BI-Konfiguration im Sinne des ressourcenbasierten Ansatzes verfügen und einem der beiden ermittelten wettbewerbsrelevanten Cluster zugeordnet werden kann. Damit ergibt sich als Handlungsempfehlung für Unternehmen die Überprüfung der Strategie, Implementierung und Betrieb ihrer BI sowie dem umgebenden Kontext und den resultierenden Folgen, um im Anschluss mögliche identifizierte Lücken zu einem der beiden wettbewerbsrelevanten Cluster schließen zu können

    Geschlechtsunterschiede in Motivation und Strategiesystematik beim selbstregulierten Erlernen eines Computerprogramms

    Get PDF
    Seit den 1980er Jahren fällt dem Computer sowohl in Beruf und Bildung als auch in der Freizeit eine wachsende Bedeutung zu (z.B. Rheinberg & Tramp, 2006). Häufig ist es für Computernutzer erforderlich, sich Computerkenntnisse selbstständig und ohne explizite Anleitung anzueignen (Richter, Naumann & Horz, 2010). Männer und Frauen erleben dabei den Umgang mit dem Computer unterschiedlich; diese Unterschiede können in Lern- und Leistungsdifferenzen resultieren (z.B. Baloğlu & Çevik, 2008). Zur Erklärung potenzieller Lern- und Leistungsunterschiede zwischen den Geschlechtern wurde in der Arbeit das kognitiv-motivationale Prozessmodell zugrunde gelegt. Das Modell erlaubt es, Leistungsunterschiede prozessnah über die aktuelle Motivation, das Flow-Erleben und die Strategiesystematik zu erklären. In Studie 1 (N = 18) wurde ein Beobachtungssystem zur Erfassung von optimalen und suboptimalen Explorationsstrategien am Computer entwickelt. In Studie 2 (N = 33) und 3 (N = 92) wurde im Rahmen eines quasiexperimentellen Designs getestet, ob sich weibliche und männliche Studierende der Wirtschaftswissenschaften in Strategiesystematik, Motivation und Leistung beim selbstregulierten Erlernen des Programms SPSS unterscheiden. Die Teilnehmer hatten nach einer kurzen Einführung in die Benutzeroberfläche von SPSS die Aufgabe, mehrere Statistikaufgaben mit SPSS zu lösen. Die Ergebnisse der Studien erbrachten zum Teil inkonsistente Befunde: Über die Studien hinweg zeigten sich keine statistisch signifikanten Unterschiede in der Motivation vor Beginn der Aufgabenbearbeitung. In Studie 2 ergaben sich jedoch Geschlechtsunterschiede in der aktuellen Motivation und der Strategiesystematik während des Bearbeitungsprozesses sowie in der Leistung. Frauen erreichten dabei niedrigere Werte bzw. weniger Punkte. In beiden Studien standen die aktuelle Motivation, das Flow-Erleben sowie die Strategiesystematik modellkonform in Beziehung mit der Leistung. Die Ergebnisse und die Methodik der Arbeit wurden abschließend kritisch diskutiert
    corecore