Vorlesungsfolien
General Game Playing Competition
|
Spezialvorlesung SS 2008: Spieltheorie - Algorithmen zur Lösung von Spielen
Dozent/Betreuung
PD Dr. Stefan Edelkamp
Dipl. Inform. Peter Kissmann
Mittwochs, 10-12 Uhr, Otto-Hahn-Str. 14, Raum 105
Achtung: Wegen des großen Andrangs: Übergangsweise Verlegung auf 202
Zuordnung Schwerpunktgebiete
4. Algorithmen, Komplexität und formale Modelle, 7. Intelligente Systeme
Thema
Das Lösen von Ein-, Zwei- und Mehrpersonenspielen
gehört zu den erfolgreichsten Anwendungen der Künstlichen
Intelligenz. Auch in der letzten Zeit gibt es immer wieder
erstaunliche Entwicklungen. Die Problem-orientierte Vorlesung
hinterleuchtet Ansätze, die in State-of-the-Art Computerspielern
verwendet werden und geht dabei weniger auf die technischen
Rafinessen, denn vor allem auf theoretischen Konzepte ein.
Inhalt
Von Ein- und Zwei-Personen-Nullsummenspielen und deren Komplexität
ausgehend, werden Spiele mit Kosten, Zufall und mehereren Spielern untersucht.
Das Lernen von Evaluationsfunktionen insbesondere in Alpha-Beta wird
thematisiert. Aus der Vielzahl von Beschleunigungstechniken werden
einige hervorgehoben. Mit UCT finden auch neuere Algorithmen Eingang, die
keine vorab definierte Evaluationsfunktion benötigen. Realzeitspiele
bilden gänzlich andere Anforderungen als Strategiespiele, und rücken
aufgrund ihres Markpotentials in den Fokus von KI-Forschern. Allgemeine
Spielprogramme nutzen keine zusätzliche Information als die Spielbeschreibung
selbst und sind somit universell einsetzbar. Der Bezug zwischen einer optimalen
Spielbeschreibung und eines ebensolchen Reglers
wird offenbar, wenn
man den Gegenspieler durch die durch die mit Unsicherheit behaftete
Umgebung ersetzen kann. Letztendlich ist die Spieltheorie ein Gebiet der
theoretischen Wirtschaftswissenschaften, neuerdings jedoch auch für
Künstliche Intelligenz und Informatik von Interesse, wenn es darum geht,
dezentrale, heterogene Systeme von egoistischen Agenten zu modellieren.
Während Lösungsbegriffe für Spiele bereits bekannt sind,
sind noch viele algorithmische Fragen zu behandeln.
Struktur
- Einleitung/Übersicht
- Einpersonenspiel
- Spielbaumsuche Zweipersonenspiel
- Minimax-Theorem
- Nicht-kooperative Spiele
- Kooperative Spiele
- Koalitionen
- Spielbaumsuche Mehrpersonenspiel
- Evaluationsfunktionen
- Kombinatorische Spieltheorie
- Spiele mit Zufall
- Allgemeine Spiele
- Realzeitspiele
- Spiele und Model-Checking
Highlights
-
Schach: Von "Null-Move Pruning" zu
"Interior-Node Recognition".
Highlight: Das PC-Computerprogramm Fritz schlägt Wladimir Kramnik
-
Schiebepuzzle: Musterdatenbanken und Externe Suche.
Highlight: Vollständige Exploration des 15-Puzzles
- Sokoban: Das Lernen von Sackgassen und Symbolisches Planen.
Highlight: Lösung von Microban-Problemen mit einem Planungssystem
- Checkers: Die Macht von Endspieldatenbanken.
Highlight: Lösung des American Checkers Problem.
- Hex: Lernen von Evaluationsfunktionen in Alpha-Beta.
Highlight: Virtuelle Verbindungen motiviert aus der E-Technik.
- Go: Kombinatorische Spieltheorie.
Highlight: Suchfreie Lösung von Nimm.
- Backgammon: Temporal Difference Learning bei
Zwei-Personen-Spielen.
Highlight: TD-Gammon spielt so gut wie der Mensch.
- Skat: Doppelter Dummy.
Highlight: Auswertung eines Blatts in Sekundenschnelle.
- StarCraft: Strategische Realzeitspiele.
Highlight: Programmier-Wettbewerb.
- General Game Playing: Monte-Carlo Sampling und UCT
Highlight: Vollständige Erreichbarkeitsanalyse von 4-Gewinnt.
- Das Paritätsspiel: Synthese von Kontrollern.
Highlight: Lösung von mu-calculus Modellprüfungsproblemen.
- Matching-Pennies, Gefangendilemma und Auktionen:
Highlight: Nash-Gleichgewichtstheorie.
- Wumpus, RaceTrack u.ä.: Markov'sche Entscheidungstheorie.
Highlight: Externe Wertiteration.
- Poker: Modellierung des Gegners.
Highlight: Aktuelle Ergebnisse der Competition.
Literatur (Auswahl)
-
Anatol Rapoport: Two-Person Game Theory, Dover
- Cameron Browne: Hex Strategy, AK Peters
- Ernst A. Heinz: Scalable Search in Computer Chess
- Werner Krabs: Spieltheorie, Dynamische Behandlung von Spielen, Teubner
- Martin Müller: Computer Go as the Sum of Local Games, ETH Zürich
- Andreas Junghanns: Pushing the Limits: New Developments in
Single-Agent Search, University of Alberta
- Bernhard Nebel: Spieltheorie, Vorlesungsskript
- Ingo Wegener/Thomas Hofmeister: Operations Research, Vorlesungsskript
...sowie aktuelle Veröffentlichung in KI-Konferenzen und Journalen
|
|