4 research outputs found
Lernbeiträge im Rahmen einer kognitiven Architektur für die intelligente Prozessführung
In dieser Arbeit werden wichtige Aspekte einer kognitiven Architektur für das Erlernen von Regelungsaufgaben beleuchtet. Dabei geht es primär um die Merkmalsextraktion, das Reinforcement Learning und das Lernmanagement im Rahmen des Wahrnehmungs-Handlungs-Zyklus.
Wichtige Beiträge sind dabei verschiedene residuumsbasierte Ansätze zur hybriden Merkmalsselektion, ein Algorithmus zur Behandlung des Explorations-Exploitation-Dilemmas in kontinuierlichen Aktionsräumen, Untersuchungen zum Rewarddekompositionsproblem, sowie die Verzahnung der einzelnen Komponenten einer funktionierenden Architektur.
Der experimentelle Nachweis, dass das vorgestellte System die Lösung für reale Probleme erlernen kann, wird am herausfordernden Szenario der intelligenten Feuerungsführung erbracht. Dabei wird das Gesamtsystem zur Regelung eines mit Steinkohle gefeuerten Kraftwerks eingesetzt. Dabei wurden Ergebnisse erzielt, die bisher existierende Systeme und auch menschliche Experten deutlich übertreffen.In this thesis, important aspects of a cognitive architecture for learning
control tasks are discussed. Highlighted are the topics of feature
extraction, reinforcement learning and learning management in the context
of the perception-action-cycle. The contributions in the field of feature
extraction utilize informationtheoretic measures such as mutual information
to formulate new hybrid feature extraction algorithms. Finding features
that are explicitly linked with the errors made by a learning system are
the focus. It is shown this approach based on residuals is superior to
classical methods. Another topic of interest is the estimation of mutual
information in the context of feature extraction. State of the art
reinforcement learning methods are investigated for their suitability for
challenging applications. This work addresses issues of learning
management, such as the exploration-exploitation dilemma, the
plasticity-stability dilemma and the reward decomposition problem. New
contributions are made in the form of the diffusion tree-based
reinforcement learning algorithm and the SMILE approach. Likewise, an
architectural extension is proposed to organize the learning process. It
uses a process map as the core piece to achieve this organization.
Experimental evidence that the proposed system can learn the solution to
real problems is presented in the challenging scenario of intelligent
combustion control. The system is used to learn a control strategy in a
coal-fired power plant. The achieved results surpass existing systems and
human experts.In dieser Arbeit werden wichtige Aspekte einer kognitiven Architektur
für das Erlernen von Regelungsaufgaben beleuchtet. Dabei geht es primär
um die Merkmalsextraktion, das Reinforcement Learning und das
Lernmanagement im Rahmen des Wahrnehmungs-Handlungs-Zyklus. Für die
Merkmalsextraktion werden dabei mit Hilfe informationstheoretischer
Größen, wie der Transinformation, neue hybride
Merkmalsextraktionsverfahren vorgestellt. Neuartig ist dabei der Ansatz,
Merkmale zu suchen, die explizit mit den gemachten Fehlern eines lernenden
Systems verknüpft sind. Es wird gezeigt, dass diese residuumsbasierten
Ansätze klassischen Methoden überlegen sind. Es wird ebenfalls
untersucht, welche Schätzverfahren für die Bestimmung der
Transinformation im Sinne der Merkmalsextraktion geeignet sind. Als
Entscheidungsinstanz der Gesamtarchitektur werden aktuelle Reinforcement
Learning Verfahren auf ihre Eignung für komplexe Anwendungen hin
untersucht. Dabei wird auch auf Probleme des Lernmanagements, wie das
Explorations-Exploitations-Dilemma, das Stabilitäts-Plastizitäts-Dilemma
und das Rewarddekompositionsproblem eingegangen. Neue Beiträge werden
dabei in Form des Diffusionsbaumbasiertes Reinforcement Learning und des
SMILE-Algorithmus geliefert. Ebenso wird eine Architekturerweiterung zum
Organisieren der Lernprozesse vorgeschlagen, welche im Kern um eine
Prozesskarte angeordnet ist. Der experimentelle Nachweis, dass das
vorgestellte System die Lösung für reale Probleme erlernen kann, wird am
herausfordernden Szenarioder intelligenten Feuerungsführung erbracht.
Dabei wird das Gesamtsystem zur Regelung eines mit Steinkohle gefeuerten
Kraftwerks eingesetzt, wobei Ergebnisse erzielt werden, die bisher
existierende Systeme und auch menschliche Experten übertreffen
Potenzial Bayes'scher Netze zur Unterstützung der Produktionsplanung und -steuerung
Das Potenzial Bayes'scher Netze (BNe) zur Unterstützung der
Produktionsplanung und -steuerung (PPS) wird identifiziert, untersucht und
aufgezeigt - sowohl theoretisch als auch praktisch. Der theoretisch
geprägte Teil stellt dar, dass sich BNe aufgrund ihrer Eigenschaften und
Fähigkeiten besonders gut zur Lösung bestimmter Probleme der PPS eignen.
Zudem stellt er BNe alternativen Verfahren zur Unterstützung der PPS
gegenüber. Der praxisorientierte Teil untermauert die Erkenntnisse aus der
Theorie. Ein Softwaresystem zur Wissensverarbeitung mittels BNe wird
entworfen und implementiert. Es werden geeignete Probleme der PPS
ausgewählt, konkretisiert und mittels des Softwaresystems gelöst. Die
Auswertung und Interpretation der Ergebnisse der Experimente gipfelt in der
Aussage, dass BNe ein Potenzial zur Unterstützung der PPS aufweisen und
dass sich BNe sehr gut zur Lösung bestimmter Probleme der PPS eignen