49 research outputs found

    Untersuchungen von evolutionären Algorithmen zum Training neuronaler Netze in der Sprachverarbeitung

    Get PDF
    Im Rahmen der vorliegenden Diplomarbeit wurde die Leistungsfähigkeit von evolutionären Algorithmen zum Training von RNN untersucht und mit gradientenbasierten Trainingsalgorithmen verglichen. Die Zielsetzung war dabei im besonderen die Prüfung der Verwendbarkeit in der Sprachverarbeitung, speziell der Spracherkennung. Zunächst wurde anhand eines Prädiktionsproblems die prinzipielle Leistungsfähigkeit von EA untersucht, indem ein MLP mit unterschiedlichen evolutionären Algorithmen trainiert wurde. Verschiedene Varianten von GA und ES sind an diesem Beispiel getestet und miteinander verglichen worden. Im Rahmen der Untersuchungen an GA stellte sich heraus, daß eine Mindestgenauigkeit der Quantisierung zur Lösung erforderlich ist. Es zeigt sich, daß die Genauigkeit der Approximation mit abnehmendem Quantisierungsfehler besser wird. Damit ist eine Behandlung dieses Problems mit grob quantisierten Gewichten nachteilig. Demgegenüber profitiert ES sowohl in der Approximationsgenauigkeit, als auch in der Konvergenzgeschwindigkeit von der direkten Darstellung der Objektvariablen als reelle Zahlen. Weiterhin zeigte sich bei ES, daß die Genauigkeit einer Lösung auch von der Populationsgröße abhängig ist, da mit wachsender Populationsgröße der Parameterraum besser abgetastet werden kann. Im Vergleich mit ES benötigten GA längere Konvergenzzeiten und bedingten zudem aufgrund der Codierung und Decodierung einen höheren Rechenaufwand als ES, so daß die Untersuchungen an RNN nur mit ES durchgeführt wurden. Zunächst wurde mit dem Latching-Problem eine, in der Komplexität eng begrenzte, Klassifikationsaufgabe mit Zeitabhängigkeiten untersucht. Die zur Verfügung gestellte Information war bei diesem Beispiel sehr gering, da der Fehler nur am Ende einer Mustersequenz berechnet wurde. Es stellte sich heraus, daß selbst bei dieser sehr einfachen Aufgabenstellung die gradientenbasierten Verfahren nach dem Überschreiten einer maximalen Mustersequenzlänge T keine Lösung finden konnten. Im Gegensatz dazu war ES in der Lage, das Problem für alle gemessenen Variationen des Parameters T zu lösen. Erst wenn während des Trainings dem Gradientenverfahren zusätzliche Informationen durch Fehlereinspeisung zur Verfügung gestellt wurde, hatte der BPTT-Algorithmus die selbe Leistungsfähigkeit. Als weiteres Experiment mit Zeitabhängigkeiten wurde das Automaton-Problem un- tersucht, welches mittels eines RNN gelöst werden sollte. Bei diesem Problem wurde besonderer Wert auf die Untersuchung des Konvergenzverhaltens bei Änderungen der Parameter von ES gelegt. Die Untersuchungen ergaben, daß die einzelnen Parameter in komplexer Weise miteinander interagieren und nur eine gute Abstimmung aller Parameter aufeinander eine befriedigende Leistung in Bezug auf Konvergenzgeschwindigkeit und Klassifikationsergebnis erbringt. Wie bei dem Latching-Problem wurde der Fehler nur am Ende einer Mustersequenz berechnet. Dies bewirkt, daß der BPTT-Algorithmus bereits bei Sequenzlängen von T = 27 nicht mehr in der Lage ist, die Zeitabhängigkeiten in dem Gradienten zu repräsentieren. Mit ES dagegen konnten RNN trainiert werden, die in der Lage sind, Sequenzlängen bis zu T = 41 richtig zu klassifizieren. Die Untersuchungen bestätigen, daß der beschränkende Faktor in erster Linie der Trainingsalgorithmus und nicht das Netzwerksparadigma ist. Die Simulationsexperimente mit zeitnormierten Sprachdaten zeigen, daß mit ES prinzipiell höhere Erkennungsleistungen als mit dem gradientenbasierten Algorithmus des BPTT erzielt werden können. Jedoch nimmt schon bei der Klassifikation der Zahlwörter Zwei und Drei die Klassifikationsleistung mit zunehmender Sequenzlänge ab. Es erfordert eine drastische Vergrößerung der Populationsgröße, um zumindest gleich gute Ergebnisse zu erzielen. Zusätzliche Tests am Automaton-Problem stützen diese Aussage. Jedoch steigt der Rechenaufwand durch Vergrößerung der Populationsgröße so stark an, daß bei nicht zeitnormierten Sprachdaten ES mit adäquater Populationsgröße nicht mehr simulierbar waren. In den Untersuchungen an dem Vokabular mit sechs Wörtern wurde der Fehler für jeden anliegenden Merkmalsvektor berechnet und im Gradienten bzw. zur Bewertung bei ES im Training verwendet. In diesen Messungen erbringen beide Algorithmen nahezu identische Klassifikationsergebnisse. Insgesamt verhindert der drastisch ansteigende Rechenaufwand bei den Sprachdaten die Verarbeitung von größeren Vokabularien und langen Wörtern durch ES. Aus der Beschränkung der Populationsgröße durch die vorhandene Rechnerkapazität resultierte eine nichtoptimale Anpassung von Selektionsdruck, Mutationsrate und Populationsverteilung im Suchraum. Insbesondere erweist sich die globale Anpassung der Strategieparameter bei den vergrößerten Populationen als problematisch. Weitere Untersuchungen an ES mit Strategien zur Selbstadaption dieser Parameter bieten sich daher für zukünftige Forschung an

    Numerische Verfahren zur Identifizierung von Fehlstellen aus Randdaten

    Get PDF
    Das Erkennen und nachfolgend die Lokalisierung einer Schädigung eines Bauteils mittels ge­messener charakteristischer Daten führt auf ein inverses Problem, das in dieser Arbeit als Optimierungsaufgabe formuliert und anschließend numerisch gelöst wird. Das mechanische Verhalten des Bauteils wird mit der Randelementmethode nachgebildet, wobei spezielle Element­typen zur Simulierung von Rissen innerhalb des Bauteils eingesetzt sowie Untersuchungen mit statischen und dynamischen Belastungen durchgeführt werden. Zur Identifizierung der Schädi­gungen werden Optimierungsstrategien mit Algorithmen aus der Neuroinformatik angewandt. Es zeigt sich, daß die Identifikation unterschiedlicher Schädigungen mittels numerischer Ver­fahren sowohl in der Statik als auch in der Dynamik erfolgreich durchgeführt werden kann, wobei nicht nur unterschiedliche Geometrien und die Anzahl der Defekte, sondern auch die Genauigkeit der Messungen einen deutlichen Einfluß auf die Identifikation haben. Die Bela­ stungsart und die Anzahl der Lastfälle sind dabei auf die Geometrie abzustimmen. Genetische Algorithmen sind sehr gut zur Schadenserkennung in statisch belasteten Strukturen geeignet, allerdings sehr rechenaufwendig. Die Ergebnisse bestätigen die Robustheit und die Zuverlässigkeit dieser Algorithmen. Wegen ihres hohen Rechenaufwands können diese Verfah­ren noch nicht auf dynamisch belastete Bauteile angewandt werden. Als auch bei dynamisch belasteten Strukturen geeignete Verfahren zur Fehlstellenidentifikation zeigen sich die Methoden des Kalman­Filters sowie der neuronalen Netze.Material defects, such as cracks and flaws, within structural components are identified and lo­calized from non­destructive testing data. In this study, the resulting inverse problem is refor­mulated as an optimization problem and solved numerically. The mechanical behaviour of a component is simulated using the boundary element method. Special elements for modelling cracks are applied. Optimization strategies including soft computing algorithms are used to analyze the influence of defects on boundary reactions caused by static as well as dynamic loa­dings. Applying these methodologies, various defects can be identified in both the static and dynamic setting. The geometry of the considered structural members determines the nature and number of the applied loadings. Not only the type and number of defects, but also measurement errors have a significant influence on the identification results. In statically loaded structures, genetic algorithms are well suited to the detection of defects. The results confirm the robustness and reliability of these algorithms. Unfortunately, they are also very computationally expensive. Hence, in most cases, they cannot be applied to analyze components which are loaded dynamically. In dynamically loaded structures, Kalman filter techniques as well as neural networks can be applied to efficiently identify cracks

    Sliding-Mode-Lernverfahren für neuronale Netzwerke in adaptiven Regelungssystemen

    Get PDF
    Die vorliegende Arbeit stellt einen Beitrag zur Nutzung von Online-trainierten neuronalen Netzwerken in sicherheitskritischen Regelungssystemen dar. Indem der Trainingsfehler und dessen Ableitung durch die vorgestellten Verfahren in eine stabile Ruhelage gezwungen werden, ist es möglich das Konvergenzverhalten des Netzwerks gezielt zu beeinflussen. Als Resultat dessen, kann das oftmals als Black-Box empfundene Netzwerktraining gegenüber klassischen Methoden transparenter gestaltet werden. Grundlage der vorgestellten Lernverfahren ist die Übertragung ausgewählter Sliding- Mode-Control-Konzepte erster und zweiter Ordnung auf das Training neuronaler Netzwerke. Durch die Verwendung der diesen Ansätzen zu Grunde liegenden Stabilitätsbedingungen, kann für die dargestellten Trainingsverfahren eine dynamische Berechnung der Lernrate umgesetzt werden. Die auf dieseWeise realisierbare Überführung der Netzwerkzustände in den asymptotisch stabilen Gleitzustand wird anhand ausgewählter Trainingsbeispiele demonstriert und hinsichtlich des Konvergenzverhaltens in Abhängigkeit eingeführter Stabilitätsparameter untersucht. Anwendung im Kontext der adaptiven Regelung sicherheitskritischer Systeme finden die dargestellten Trainingsverfahren als Teil einer nichtlinearen dynamischen Inversionsregelung. Zur Darstellung der generischen Natur der entwickelten Verfahren werden dabei sowohl ein Flug- als auch ein Fahrzeugregler mit Erweiterung um neuronale Netzwerke umgesetzt und in nichtlinearen Simulationen untersucht. Dabei unterstreichen die Ergebnisse sowohl die im Vergleich zu etablierten Ansätzen erhöhte Konvergenzgeschwindigkeit, als auch die gestiegene Robustheit gegenüber Parameterunsicherheiten und Systemschäden. In besondereWeise kann die vereinfachte Anwendbarkeit von neuronalen Netzwerken mit Verwendung der entwickelten Lernverfahren, durch die direkte Übertragbarkeit der Trainingsparameter zwischen den beiden vorgestellten Regelungsanwendungen, gezeigt werden. Darüber hinaus demonstrieren praktische Fahrversuche die Relevanz von adaptiven Regelungssystemen für den Ausgleich auftretender Systemfehler. Dabei wird durch die Untersuchung des Sliding-Mode-Lernverfahrens sowie dem Vergleich des Inversionsreglers mit einem nicht lernfähigen Regelungskonzept der Vorteil von schnellen und robust trainierten neuronalen Netzwerken unterstrichen.The present thesis makes a contribution to the use of online-trained neural networks in safety critical control systems. By forcing the training error and its derivation into the stable point of origin, it is possible to directley influence the convergence behavior of the network. As a result, the network training often perceived as black box can be made more transparent compared to classical methods. The basis of the presented learning methods is the transfer of selected first and second order sliding mode control concepts to the training of neural networks. Through the use of the intrinsic stability conditions, a dynamic calculation of the learning rate can be implemented for the presented training methods. The transition of the network states into the asymptotically stable sliding mode is demonstrated by means of selected training examples and examined with respect to the convergence behavior as a function of the introduced stability parameters. Applied in the context of the adaptive control of safety-critical systems, the presented training methods become part of a non-linear dynamic inversion controller. To illustrate the generic nature of the developed methods, both a flight controller and a vehicle controller with extension of neural networks are implemented and tested in non-linear simulations. The results underline the increased speed of convergence as compared to established approaches as well as the increased robustness against parameter uncertainties and system failures. In particular, the simplified applicability of neural networks using the developed learning methods can be demonstrated. Due to the direct transferability of the training parameters between the two control applications presented, a time-consuming empirical determination of the learning rate can be avoided. In addition, practical driving tests demonstrate the relevance of adaptive control systems for the compensation of system errors. The advantage of fast and robustly trained neural networks is underlined by the study of the sliding mode learning method and the comparison of the inversion controller with a non-adaptive control concept

    Application of Neural Networks in Adaptive Flight Control Systems

    Get PDF
    Die vorliegende Arbeit stellt einen Beitrag zur Einbindung künstlicher neuronaler Netzwerke in adaptive Regelungssysteme dar. Neben den Grundlagen zur Abbildung dynamischer Prozesse mit neuronalen Netzen wird eine strukturierte Methodik des Netzwerkentwurfes dargestellt, die eine statistische Bewertung des Lernerfolges ermöglicht. Darüber hinaus wird eine Klasse regelungstechnisch motivierter Lernverfahren vorgestellt, welche neuronale Netze als dynamische Systeme aufgefasst, womit das Lernen innerhalb eines Netzwerkes als geregelter Prozess betrachtet werden kann. Dies erlaubt die Anwendung der Gleitzustandsregelung auf neuronale Lernverfahren, welche so um eine intrinsische Stabilitätsbedingung erweitert werden können. Durch die dynamische Bestimmung der Lernraten vermag dieser Lernansatz die Zustände eines neuronalen Netzes in den global asymptotisch stabilen Gleitzustand zu überführen. Die praktische Bedeutung dieses Lernverfahrens wird am Beispiel zweier Regelungsstrategien dargestellt: Der modellfreien neuronalen Regelung und der neuronal gestützten dynamischen Inversion. Die Ergebnisse beider Regelungsverfahren unterstreichen die robusten Eigenschaften neuronaler Netze zur Abbildung komplexer dynamischer Prozesse. Es zeigen sich besondere Vorteile bei der Kombination von dynamischer Inversion und neuronalen Netzwerken, die mit dem Gleitzustandslernverfahren trainiert werden. Dies liegt darin begründet, dass die Überführung der Zustandsgrößen des Netzes in den Gleitzustand eine stabilisierende Wirkung auf die Fehlerdynamik des Regelkreises besitzt. Am Beispiel eines beschädigten unbemannten Flugzeuges zeigt sich, dass dieses Verfahren wegen seiner dynamischen Bestimmung der Lernrate eine höhere Konvergenzgeschwindigkeit als vergleichbare etablierte Ansätze aufweist. Die Ergebnisse unterstreichen die Vorzüge der Kombination von klassischer Regelungstechnik und Maschinenlernverfahren bei der Auslegung komplexer Regelungssysteme.The present work makes a contribution to the integration of artificial neural networks into adaptive control systems. Besides the basic principles of mapping dynamic processes using neural networks, a structured methodology for the network design is illustrated, which allows a statistical evaluation of the learning success. In addition, to allow for an improved transparency of neural networks used in control systems a paradigm change regarding their learning methods is undertaken. This means that a neural network is treated as a dynamic system whereby the learning within such a network becomes a controlled process. Therefore, the application of sliding mode control to learning techniques of neural networks is possible, which thereby can be augmented with an intrinsic stability condition. Through the dynamic calculation of the learning rate this approach is able to constrain the network’s states into the globally asymptotically stable sliding mode. The practical relevance of this learning method is illustrated utilising two control strategies: the indirect adaptive neuro-control and the nonlinear dynamic inversion. The results of both control methods underline the robust capabilities of neural networks to map complex dynamic processes. Furthermore, particular advantages arise from the combination of dynamic inversion and neural networks trained with the sliding mode learning method. This is the case because constraining the network’s states to the sliding mode offers an enhanced stabilising effect upon the error dynamics of the closed-loop control system. Using the example of a damaged unmanned aircraft under perturbation it is shown, that the sliding mode learning technique due to the dynamic calculation of the learning rate offers a higher speed of convergence than comparable established methods. The results emphasise the advantages of the combination of control theory and machine learning techniques for the design of complex control systems

    Identifikation von Verkehrslasten unter Einsatz von Methoden des Soft Computing

    Get PDF
    Ziel der Arbeit war die Entwicklung eines durchgängigen Ansatzes zur Identifikation von statischen Verkehrslasten auf der Basis gemessener Querschnittsdehnungen von Brückenüberbauten. Vor dem Hintergrund stetig steigender Beanspruchungen der bestehenden Brückenbauwerke sollte die zu entwickelnde Methodik in Monitoringsysteme der kontinuierlichen Zustandsüberwachung integrierbar sein. Dieser Anforderung entsprechend sollten die Verkehrslasten indirekt im Rahmen einer modellbasierten Lastidentifikation ermittelt werden. Zur Sicherstellung einer ausreichenden Robustheit gegenüber teilweise verrauschten und ungenauen Messgrößen sowie zum Erhalt der globalen Lösungen wurden Methoden des Soft Computing eingesetzt. Als stochastische Suchverfahren wurden Evolutionäre Algorithmen verwendet. Künstliche Neuronale Netze wurden hybrid in das Vorgehen eingebunden und unterstützten einen effizienten Optimierungsprozess. Die Gültigkeit für mechanisch lineare und nichtlineare Systeme wurde durch den gekapselten Einsatz des Vorwärtslösers gewährleistet. Zur Auswertung von kontinuierlich erfassten Messgrößen wurden geeignete Verfahren untersucht. Durch die gezielte Beschränkung auf die Tragwerksreaktionen, welche in besonderem Maße auf die einwirkenden Lasten schließen lassen, wurde die Anzahl der erforderlichen Messelemente minimiert. Sowohl Anforderungen hinsichtlich der Wirtschaftlichkeit als auch Anforderungen bezüglich der Effizienz der Messdatenanalyse wurden hierdurch erfüllt. Die eigenen Entwicklungen wurden im 'Identification-in-Motion' (IIM)-Algorithmus zusammengefasst. Der Algorithmus berücksichtigt die Analyse von Tragwerksreaktionen, die kontinuierlich an entsprechend instrumentierten Brücken erfasst werden. Für jeweils einzelne Fahrzeuge werden mit seiner Hilfe der Auftretenszeitpunkt, das Gesamtgewicht, die Geschwindigkeit, die Achslasten und -abstände ermittelt. Der IIM-Algorithmus wurde prototypisch implementiert und zur Auswertung von Messdaten, die im Rahmen der Dauerüberwachung des Überbaus einer Betonbrücke gewonnen wurden, eingesetzt. Das Potential der eigenen Entwicklungen konnte hierdurch demonstriert werden

    Bewertung Amerikanischer Optionen mit Hilfe von regressionsbasierten Monte-Carlo-Verfahren

    Get PDF
    In der vorliegenden Arbeit wird die Bewertung Amerikanischer Optionen in diskreter Zeit mit Hilfe von regressionsbasierten Monte-Carlo-Verfahren betrachtet. Die Optionen dürfen dabei auf mehreren Underlyings basieren (so genannte Basket-Optionen). Für die Preisprozesse der Underlyings wird angenommen, dass diese die Markov-Eigenschaft besitzen und somit Markov-Prozesse sind. Mit Monte-Carlo-Verfahren werden dann künstliche Stichprobenpfade dieser Preisprozesse erzeugt, um anschließend mit adaptiven nichtparametrischen Kleinste-Quadrate-Regressionsschätzern ausgehend von diesen Stichprobenpfaden die so genannten Kontinuierungswerte zu schätzen. Dabei beschreiben die Kontinuierungswerte die Mittelwerte der Amerikanischen Optionen für gegebene Kurse der Underlyings zur Zeit t gemäß der Bedingung, dass die Optionen nicht zur Zeit t, sondern optimal in der Zukunft ausgeübt werden. Als nichtparametrische Regressionsschätzer werden adaptive Kleinste-Quadrate-Splineschätzer sowie adaptive Neuronale-Netze-Schätzer verwendet. Diese Schätzer werden im Zusammenhang mit der Bewertung Amerikanischer Optionen theoretisch analysiert, und Resultate zur Konsistenz und zur Konvergenzgeschwindigkeit werden hergeleitet. Abschließend wird mit den Schätzern das Bewerten Amerikanischer Optionen auf simulierten Daten illustriert.Pricing of American options in discrete time by means of regression-based Monte Carlo methods is considered in this thesis. Thereby, the options are allowed to be based on several underlyings (so-called basket options). It is assumed that the underlyings price processes satisfy the Markov property and consequently are Markov processes. In this dissertation, Monte Carlo methods are used to generate artificial sample paths of these price processes, and subsequently adaptive nonparametric least squares regression estimates are used to estimate the so-called continuation values from these data. The continuation values describe the mean values of the American options for given values of the underlyings at time t, subject to the constraint that the options are not exercised at time t, but optimally exercised in the future. Adaptive least squares neural networks as well as adaptive least squares spline estimates are used as nonparametric regression estimates. In conjunction with the pricing of American options, these estimates are theoretically analysed, and results with respect to consistency and rate of convergence are derived. Finally, the pricing of American options on simulated data by means of the estimates is illustrated
    corecore