Hauptseite

Vorlesungsfolien (2004)

Vorlesungsskipt (2004)

Die folgende Einteilung von Stoffinhalten in Vorlesungseinheiten ist nicht endgültig, aber mag zur Orientierung helfen.

Part I: Handlungsplanung

Einleitung: Was ist Handlungsplanung?

International Planning Competitions. PDDL (Planning Domain Definition Language): STRIPS (McDermott), ADL (Pednault); PDDL2.1 (Fox und Long): Level 2: Numerisches Planen; Level 3: Temporales Planen; PDDL2.2 (Edelkamp and Hoffmann) Abgeleitete Prädikate und Zeitfenster für Literale; nuPDDL(Cimatti et al.): Nichtdeterministisches Planen; PPDDL: Probabilistisches Planen (Younes and Littman).

Propositionale Algorithmen.

Effizientes paralleles Planen mit Graphen (Furst und Blum); Erfüllbarkeitsplanen (Kautz und Selman); Planen mit Constraints (Khampampati et al.)

Planen durch heuristischer Suche.

A* und IDA*. Design von Heuristiken, insbes. Max-Atom und Max-Pair (Bonet, Geffner und Haslum) Musterdatenbanken (Edelkamp). Enforced Hill-Climbing, Das HSP und das FF Planungssystem (Hoffmann).

Planen mit BDDs

Boole'sche Codierung von Zustäanden und Übergängen. Symbolische Breiten- und heuristische Suche: BDDA*/SetA*.

Nummerisches Planen.

Level 2, PDDL2.1: Fluents und Metriken. Syntax und Semantik. Erweiterung der relaxierten Planungsheuristik. Formalisierung und Instantiierungen. Die Propagierung von Bedingungen. Implementationen in den Systemen Metrik-FF (Hoffmann) und MIPS-04. Planen als Integer-Programm (Walser and Kautz).

Temporales Planen.

Parallelisierung sequentieller Pläne: Kritische Pfade und Temporale Netze. Lagrange Multiplikatoren. Implementation in dem System MIPS-02. Alternative Ansätze in den Systemen SAPA (Khampampati et al.) und LGP (Gerevini und Serina).

Nicht-deterministisches Planen.

schwaches, starkes und stark-zyklisches Planen. Universelles Planen und Zustandsaktionstabellen. Planen mit BDDs in MBP/nuSMV (Cimatti et al.) Extended Goals (Traverso et al.) Planen mit Gegenspielern. Das UMOP System (Jensen et al.)

Konformantes Planen.

Konditionale Effekte, Planfindung mit BDDs und Graphen (Smith et al.). Explizite (Brafman und Hoffmann) und symbolische Ansätze (Guinchiglia, Cimatti et al.) Das System QBF-Plan (Rintanen).

Wahrscheinlichkeits-theoretisches Planen.

Markov'sche Entscheidungsprobleme (MDP). Anwendungen in der Robotik. Algorithmen fü probabilistisches Planen mit voller Beobachtung (MDPs): "Policy Iteration", "Value Iteration". ADDs Implementation der "Value Iteration". Das SPUDD System von Hoey et al. Heuristisch-probabilistisches Planen (Feng, Hansen und Zilberstein) Transitionssystem-Semantik von PDDL.

Kontingentes Planen.

Planen mit eingeschränkter Beobachtbarkeit. Weltzustände und der "Belief"-Zustandsraum. POMDPs, Stochastische SAT Planung. Nichtdeterministisches Planen mit eingeschränkter Beobachtbarkeit und BDDs.

Planen mit automatischen Hilfestellungen.

Invariantenerkennung, Zustandsminimierung, Operatormengen- und Symmetriereduktion. Die Ansätze von Fox und Long, Haslum in den Systemen STAN und TP4. Planen mit nicht-automatischen Hilfestellungen: Planen durch Dekomposition, Hierarchisches Planen (HTN). Das SHOP-System (Nau et al.). Beschneidung mit temporalen Kontrollregeln: Die Systeme TAL-plan (Doherty et al.) und TL-plan (Kabanza und Bacchus).

Komplexitätsresultate in der Handlungsplanung.

Komplilationen (Nebel) Vergleich deterministisches, konditionales Planen mit und ohne Beobachtung, (PO)MDP Planen und numerisches Planen (Bylander, Helmert, Mundhenk et al.)

Neue Entwicklungen in der Handlungsplanung.

PDDL2.2-Planen mit Zeitfenstern und Axiomen bzw abgeleiteten Prädikaten. Deadlines und die Existenz von Fixpunkten (Thiebeaux et al.).

Part II: Allgemeines Spiel

Handlungsplanung & Allgemeines Spiel

Stefan Edelkamp (edelkamp@tzi.de)