Fachkonzept: Wahrnehmungs-Aktions-Schleife

Reinforcement Learning (deutsch: „Verstärkungslernen“) beschreibt verschiedene Verfahren des Maschinellen Lernens, bei dem ein Programm lernt, möglichst optimale Aktionen in bestimmten Situationen seiner Umwelt auszuführen. Ein Software-Programm, das die Handlungen situationsabhängig steuert, wird in der Informatik auch als „Software-Agent“ oder kurz „Agent“ bezeichnet (lat.: agere – handeln). Ein typsicher Software-Agent ist ein (computergesteuerter) Gegenspieler in einem Computerspiel. Das Spielszenario selbst stellt seine Umwelt dar. Wenn ein Agent nicht fest programmiert ist sondern optimales Handeln erst erlernen muss, so muss er während des Lernvorgangs eine Rückmeldung darüber erhalten, wie gut eine bestimmte Handlung war und wie sich diese auf seine Situation innerhalb seiner Umwelt ausgewirkt hat. Wir müssen also drei Dinge unterscheiden:

Das ständige Wiederholen der Schritte : (a) Wahrnehmen der jeweiligen Situation, (b) das Entscheiden über die durchzuführende Aktion und (c) die Bewertung der hieraus resultierenden Belohnung wird als Wahrnehmungs-Aktions-Schleife (Perception-Action-Loop) oder Wahrnehmungs-Aktions-Zyklus (Perception-Action-Cycle) bezeichnet.
Wahrnehmungs-Handlungs-Schleife[1]

Quellen

X

Fehler melden

X

Suche