osnaDocs: Dateneffiziente selbstlernende neuronale Regler

Dateneffiziente selbstlernende neuronale Regler

Please use this identifier to cite or link to this item:
https://osnadocs.ub.uni-osnabrueck.de/handle/urn:nbn:de:gbv:700-2009120719

Title:	Dateneffiziente selbstlernende neuronale Regler
Authors:	Hafner, Roland
Thesis advisor:	Prof. Dr. Martin Riedmiller
Thesis referee:	Prof. Dr. Horst-Michael Groß
Abstract:	Die vorliegende Arbeit untersucht den Entwurf und die Anwendung selbstlernender Regler als intelligente Reglerkomponente im Wirkungsablauf eines Regelkreises für regelungstechnische Anwendungen. Der aufwändige Prozess der Analyse des dynamischen Systems und der Reglersynthese, welche die klassischen Entwurfsmuster der Regelungstechnik benötigen, wird dabei ersetzt durch eine lernende Reglerkomponente. Diese kann mit sehr wenig Wissen über den zu regelnden Prozess eingesetzt werden und lernt direkt durch Interaktion eine präzise Regelung auf extern vorgegebene Führungsgrößen. Der Lernvorgang basiert dabei auf einem Optimierungsprozess mit einem leistungsfähigen Batch-Reinforcement-Lernverfahren, dem ´Neural Fitted Q-Iteration´. Dieses Verfahren wird auf seine Verwendung als selbstlernender Regler untersucht. Für die in den Untersuchungen festgestellten Unzulänglichkeiten des Verfahrens bezüglich der geforderten präzisen, zeitoptimalen Regelung werden verbesserte Vorgehensweisen entwickelt, die ebenfalls auf ihre Leistungsfähigkeit untersucht werden.Für typische regelungstechnische Problemstellungen sind die diskreten Aktionen des NFQ-Verfahrens nicht ausreichend, um eine präzise Regelung auf beliebige Führungsgrößen zu erzeugen.Durch die Entwicklung einer Erweiterung des NFQ für kontinuierliche Aktionen wird die Genauigkeit und Leistungsfähigkeit der selbstlernenden Regler drastisch erhöht, ohne die benötigte Interaktionszeit am Prozess zu erhöhen.An ausgewählten Problemen der Regelung linearer und nichtlinearer Prozesse wird die Leistungsfähigkeit der entwickelten Verfahren empirisch evaluiert. Es zeigt sich dabei, dass die hier entwickelten selbstlernenden Regler mit wenigen Minuten Interaktionszeit an einem Prozess eine präzise Regelungsstrategie für beliebige externe Führungsgrößen lernen, ohne dass Expertenwissen über den Prozess vorliegt.
URL:	https://osnadocs.ub.uni-osnabrueck.de/handle/urn:nbn:de:gbv:700-2009120719
Subject Keywords:	Reinforcement Lernen; Regelungstechnik; maschinelles Lernen; kontinuierliche Aktionen
Issue Date:	4-Dec-2009
Submission date:	4-Dec-2009
Type of publication:	Dissertation oder Habilitation [doctoralThesis]
Appears in Collections:	FB06 - E-Dissertationen

Files in This Item:

File	Description	Size	Format
E-Diss974_thesis.pdf	Präsentationsformat	5,02 MB	Adobe PDF	E-Diss974_thesis.pdf View/Open

Show full item record

Items in osnaDocs repository are protected by copyright, with all rights reserved, unless otherwise indicated. rightsstatements.org