Struktur

Vorlesungsfolien (2004)

Vorlesungsskript (2004)

International Planning Competitions

General Game Playing (Stanford)

General Game Playing (Dresden)

Vorlesungsteil Allgemeines Spiel

Literatur

Spezialvorlesung
WS 10/11: Handlungsplanung und Allgemeines Spiel


PD Dr. Stefan Edelkamp Dipl.-Inform. Peter Kissmann Termine: Mi 10-12, Do 10-12, Raum 1.50 (TZI, TAB, Fallturm 1)

Modul

602 (Algorithmen- und Komplexitätstheorie), 2+2 SWS, 6 ECTS

Thema

Die Vorlesung gibt einen Einblick in den aktuellen Forschungsstand und neue Forschungsrichtungen in der Handlungsplanung und im Allgemeinen Spiel.

Handlungsplanung

In der Vorlesung werden verschiedene Planungsformalismen vorgestellt, ihre Komplexität untersucht und Algorithmen zur Lösung des Planungsproblems besprochen. Im klassischen, deterministischen Planen betrachten wir den propositionalen STRIPS-Kalkül, ADL-Erweiterungen und ihre Verarbeitung, numerisches, temporales Planen mit Optimierungsfunktionen in PDDL2.1, sowie Zeitfenster und abgeleitete Prädikate in PDDL2.2. Als Planungsverfahren werden u.a. Planen in Graphen, Planen durch lokale Suche, Planen durch heuristische Suche mit Musterdatenbanken, Planen als aussagenlogisches Erfüllbarkeitsproblem und Planen mit BDDs beschrieben. Für numerisches Planen wird die heuristische Suche erweitert und für temporales Planen ein Scheduling-Ansatz besprochen, der sequentiell in der Suche erzeugte Pläne optimal parallelisiert. Neben dem klassischen Planen werden Planungsansätze zum nicht-deterministischen, konformanten und wahrscheinlichkeitstheoretischen Planen besprochen, in denen Pläne in Form von Zustands-Aktionspaaren dargestellt werden. Wahrscheinlichkeitstheoretisches Planen erweist sich dabei als besonders schwierig. Ein Zweig des nicht-deterministischen Planens birgt eine enge Verbindung zum Zeipersonenspiel. Als Planungsverfahren werden vorgestellt: schwaches, starkes und konformantes Planen mit BDDs. Planen mit unvollständiger Information durch heuristische Suche. Politik- oder Wertiteration zur Lösung von MDP und POMDP Problemen mit und ohne ADDs. Als Techniken zur Vereinfachung von Planungsproblemen werden u.a. die Berechnung von Invarianten für Planungsprobleme, die Symmetrieerkennung von Objekttranspositionen und das Planen mit reduzierten Operatorlisten besprochen.

Allgemeines Spiel (engl. general game playing, GGP)

Forschungszweig, in dem Spiele in einer problemunabhägigen Beschreibungssprache formuliert werden und dazu aufgerufen wird, Spieler zu konzipieren, die über eine geeignete Schnittstelle gegen einen Menschen oder gegeneinander antreten. Die Spiele sind endlich und terminale Zustände werden über Auszahlungsvektoren mit Werten im Bereich {0,. . . ,100} beschriftet. Algorithmen propagieren diese Werte innerhalb des Suchbaumes möglicher Abspiele zu dem aktuellen Spielzustand, um daraus eine gewinnversprechende Nachfolgerwahl zu ermöglichen. Der heute wohl am weitesten verbreitete Beschreibungsformalismus GDL (Game Description Language) ist eine logikbasierte Beschreibungssprache, die - im Gegensatz zu PDDL, das häufig in der Handlungsplanung zum Einsatz kommt - auf dem Situationskalkül beruht und statische Definitionsblöcke, welche in Datalog beschrieben werden, besitzt. Es gibt nationale und internationale Wettbewerbe, von denen jener auf der amerikanischen KI-Konferenz AAAI am höchsten dotiert ist letzterer ist sicherlich auch ein Grund für den Erfolg dieses Formalismus. Das allgemeine Spiel wurde ursprünglich von der Logik- Gruppe der Universität Stanford initiiert und gefördert; in Deutschland war in den letzten Jahren die Gruppe um Michael Thielscher an der gebend - dort findet sich auch ein Server, auf dem Spieler gegeneinander antreten können. Neben einfachen Klassikern wie Nimm oder Tic-Tac-Toe liegen bereits Spiele wie Schach, Dame oder Halma teils in vereinfachter, teils in vollständiger Spezifikation vor, wobei es sich alich um deterministische, endliche Spiele mit vollständiger Information handelt. Die Endlichkeit wird häufig über einen Zugzähler sichergestellt und ein Spiel endet, wenn eine bestimmte Anzahl an Zügen durchgeführt wurde. Erste erfolgreiche Implementierungen von Spielern wie etwa CLUNEPLAYER und FLUXPLAYER verwenden Heuristiken basierend auf αβ-Pruning. Dabei können Mehrpersonenspiele beispielsweise als Varianten des Zweipersonenspiels aufgefasst werden, indem die Spieler in zwei Mannschaften unterteilt werden: Diejenigen, die mit dem eigenen Spieler kooperieren (was sich etwa darin zeigt, dass sie die gleiche Bewertung in sämtlichen Zielzuständen bekommen), und diejenigen, die gegen ihn spielen. Ein weiterer aktueller Trend im allgemeinen Spiel ist der UCT Algorithmus (Upper Confidence Bounds Applied to Trees), bei dem nur ein Teil des Spielgraphen im Speicher gehalten wird und eine Einschätzung üer die Qualität einer Position durch zufällige Abspiele ermittelt wird. Die Sieger der letzten drei internationalen Meisterschaften haben diesen Ansatz verfolgt und ihn für Mehrpersonenspiele erweitert.

Software

In der Vorlesung wird das Planungssystem GAMER zur Fallstudie genutzt. Desweiteren werden aktuelle Systeme vorgestellt. Als Beispiele dienen Probleme aus den Planungs- und GGP-Wettbewerben.

Übung

Anstatt einer traditionellen Übung mit zu bearbeitbaren Zetteln wird von den Studierenden begleitend durch die Vorlesung schrittweise ein Handlungsplaner oder Allgemeiner Spieler in Gruppenarbeit programmiert. Am Ende der Vorlesung findet eine Präsentation / Wettbewerb statt.

Literatur

Zu der Vorlesung wird ein Skript (evtl. in zwei Teilen) erstellt.

M. Ghallab, D. Nau, and P. Traverso. Automated Planning: Theory and Practice. Morgan Kaufmann, 2004.

Weitere Resultate entspringen richtungsweisenden Veröffentlichungen der letzten Jahre. mehr...

Handlungsplanung & Allgemeines Spiel

Stefan Edelkamp (edelkamp@tzi.de)