[Chair] [Computer Science Department (FBI)] [Technical University Dortmund]

Spezialvorlesung
SS 2008: Spieltheorie - Algorithmen zur Lösung von Spielen

Dozent/Betreuung

Mittwochs, 10-12 Uhr, Otto-Hahn-Str. 14, Raum 105 Achtung: Wegen des großen Andrangs: Übergangsweise Verlegung auf 202

Zuordnung Schwerpunktgebiete

4. Algorithmen, Komplexität und formale Modelle, 7. Intelligente Systeme

Thema

Das Lösen von Ein-, Zwei- und Mehrpersonenspielen gehört zu den erfolgreichsten Anwendungen der Künstlichen Intelligenz. Auch in der letzten Zeit gibt es immer wieder erstaunliche Entwicklungen. Die Problem-orientierte Vorlesung hinterleuchtet Ansätze, die in State-of-the-Art Computerspielern verwendet werden und geht dabei weniger auf die technischen Rafinessen, denn vor allem auf theoretischen Konzepte ein.

Inhalt

Von Ein- und Zwei-Personen-Nullsummenspielen und deren Komplexität ausgehend, werden Spiele mit Kosten, Zufall und mehereren Spielern untersucht. Das Lernen von Evaluationsfunktionen insbesondere in Alpha-Beta wird thematisiert. Aus der Vielzahl von Beschleunigungstechniken werden einige hervorgehoben. Mit UCT finden auch neuere Algorithmen Eingang, die keine vorab definierte Evaluationsfunktion benötigen. Realzeitspiele bilden gänzlich andere Anforderungen als Strategiespiele, und rücken aufgrund ihres Markpotentials in den Fokus von KI-Forschern. Allgemeine Spielprogramme nutzen keine zusätzliche Information als die Spielbeschreibung selbst und sind somit universell einsetzbar. Der Bezug zwischen einer optimalen Spielbeschreibung und eines ebensolchen Reglers wird offenbar, wenn man den Gegenspieler durch die durch die mit Unsicherheit behaftete Umgebung ersetzen kann. Letztendlich ist die Spieltheorie ein Gebiet der theoretischen Wirtschaftswissenschaften, neuerdings jedoch auch für Künstliche Intelligenz und Informatik von Interesse, wenn es darum geht, dezentrale, heterogene Systeme von egoistischen Agenten zu modellieren. Während Lösungsbegriffe für Spiele bereits bekannt sind, sind noch viele algorithmische Fragen zu behandeln.

Struktur

Einleitung/Übersicht
Einpersonenspiel
Spielbaumsuche Zweipersonenspiel
Minimax-Theorem
Nicht-kooperative Spiele
Kooperative Spiele
Koalitionen
Spielbaumsuche Mehrpersonenspiel
Evaluationsfunktionen
Kombinatorische Spieltheorie
Spiele mit Zufall
Allgemeine Spiele
Realzeitspiele
Spiele und Model-Checking

Highlights

Schach: Von "Null-Move Pruning" zu "Interior-Node Recognition". Highlight: Das PC-Computerprogramm Fritz schlägt Wladimir Kramnik
Schiebepuzzle: Musterdatenbanken und Externe Suche. Highlight: Vollständige Exploration des 15-Puzzles
Sokoban: Das Lernen von Sackgassen und Symbolisches Planen. Highlight: Lösung von Microban-Problemen mit einem Planungssystem
Checkers: Die Macht von Endspieldatenbanken. Highlight: Lösung des American Checkers Problem.
Hex: Lernen von Evaluationsfunktionen in Alpha-Beta. Highlight: Virtuelle Verbindungen motiviert aus der E-Technik.
Go: Kombinatorische Spieltheorie. Highlight: Suchfreie Lösung von Nimm.
Backgammon: Temporal Difference Learning bei Zwei-Personen-Spielen. Highlight: TD-Gammon spielt so gut wie der Mensch.
Skat: Doppelter Dummy. Highlight: Auswertung eines Blatts in Sekundenschnelle.
StarCraft: Strategische Realzeitspiele. Highlight: Programmier-Wettbewerb.
General Game Playing: Monte-Carlo Sampling und UCT Highlight: Vollständige Erreichbarkeitsanalyse von 4-Gewinnt.
Das Paritätsspiel: Synthese von Kontrollern. Highlight: Lösung von mu-calculus Modellprüfungsproblemen.
Matching-Pennies, Gefangendilemma und Auktionen: Highlight: Nash-Gleichgewichtstheorie.
Wumpus, RaceTrack u.ä.: Markov'sche Entscheidungstheorie. Highlight: Externe Wertiteration.
Poker: Modellierung des Gegners. Highlight: Aktuelle Ergebnisse der Competition.

Literatur (Auswahl)

Anatol Rapoport: Two-Person Game Theory, Dover
Cameron Browne: Hex Strategy, AK Peters
Ernst A. Heinz: Scalable Search in Computer Chess
Werner Krabs: Spieltheorie, Dynamische Behandlung von Spielen, Teubner
Martin Müller: Computer Go as the Sum of Local Games, ETH Zürich
Andreas Junghanns: Pushing the Limits: New Developments in Single-Agent Search, University of Alberta
Bernhard Nebel: Spieltheorie, Vorlesungsskript
Ingo Wegener/Thomas Hofmeister: Operations Research, Vorlesungsskript

...sowie aktuelle Veröffentlichung in KI-Konferenzen und Journalen

Spieltheorie

Stefan Edelkamp (stefan.edelkamp@cs.uni-dortmund.de)

Spezialvorlesung SS 2008: Spieltheorie - Algorithmen zur Lösung von Spielen