Verhalten aus der Q-Tabelle
Aufgabe 1: Ausgabe der möglichen Aktionen
Ergänze die Funktionbeste_aktion
am Anfang um einige Programmzeilen, die mit einer Schleife nacheinander alle Aktionen ausgeben, die bei Situation Nr. s
möglich sind. Tipp: Die Liste kann in Python einfach durchlaufen werden mit
Aufgabe 2: Zugriff auf Werte der Q-Tabelle
Ergänze die Funktionbeste_aktion
so, dass zu den möglichen Aktionen auch die entsprechenden Q-Werte angezeigt werden. Tipp: Der Q-Wert zu Situation 5 und Aktion 3 kann ausgegeben werden mit
Aufgabe 3: Bestimmung des Verhaltens aus der Q-Tabelle
Ändere die Funktionbeste_aktion
so ab, dass die hartkodierten if
-Anweisungen wieder gelöscht werden. Stattdessen soll für die Situation s
durch eine Schleife die beste Aktion, also die mit dem größten Q-Wert gefunden werden. Die Nummer dieser besten Aktion soll dann das Ergebnis der Funktion sein, also mit return
zurück gegeben werden.Dabei sollen nur die Aktionen betrachtet werden, die in der Liste
moegliche_aktionen
stehen. Aufgabe 4: Test
Teste das Verhalten des Programms, indem duspiel_ki.py
startest und dir den Spielverlauf anschaust.