Wie korrelierte Gleichgewichte funktionieren Teil2 (Informatik) | von Monodeep Mukherjee | Juni 2023

0
24


  1. Kombinatorik korrelierter Gleichgewichte (arXiv)

Autor: Marie-Charlotte Brandenburg, Benjamin Hollering, Irem Portakal

Zusammenfassung: Wir untersuchen das korrelierte Gleichgewichtspolytop PG eines Spiels G aus kombinatorischer Sicht. Wir führen den Bereich der Volldimensionalität für diese Klasse von Polytopen ein und beweisen, dass es sich für jedes Spiel um eine semialgebraische Menge handelt. Durch die Verwendung der orientierten Matroidschichten schlagen wir eine strukturierte Methode zur Beschreibung der möglichen kombinatorischen Typen von PG vor und zeigen, dass für (2×n)-Spiele die algebraische Grenze jeder Schicht die Vereinigung von Koordinatenhyperebenen und Binomialhyperflächen ist . Abschließend liefern wir einen rechnerischen Beweis dafür, dass es einen einzigartigen kombinatorischen Typ maximaler Dimension für (2×3)-Spiele gibt

2. Lernen korrelierter Gleichgewichte in Imply-Discipline-Spielen (arXiv)

Autor: Paul Müller, Romuald Elie, Mark Rowland, Mathieu Lauriere, Julien Perolat, Sarah Perrin, Matthieu Geist, Georgios Piliouras, Olivier Pietquin, Karl Tuyls

Zusammenfassung: Die Entwürfe vieler großer Systeme basieren heute, von Verkehrsleitumgebungen bis hin zu Sensible Grids, auf spieltheoretischen Gleichgewichtskonzepten. Da jedoch die Größe eines N-Spieler-Spiels typischerweise exponentiell mit N zunimmt, ist eine standardmäßige spieltheoretische Analyse ab einer geringen Anzahl von Spielern praktisch nicht mehr durchführbar. Neuere Ansätze haben diese Einschränkung umgangen, indem sie stattdessen Imply-Discipline-Spiele in Betracht gezogen haben, eine Annäherung an anonyme N-Spieler-Spiele, bei denen die Anzahl der Spieler unendlich ist und die Zustandsverteilung der Bevölkerung anstelle des Zustands jedes einzelnen Spielers das Objekt des Interesses ist. Die praktische Berechenbarkeit von Imply-Discipline-Nash-Gleichgewichten, dem bislang am meisten untersuchten Imply-Discipline-Gleichgewicht, hängt jedoch typischerweise von vorteilhaften nicht generischen Struktureigenschaften wie Monotonie oder Kontraktionseigenschaften ab, die für die Konvergenz bekannter Algorithmen erforderlich sind. In dieser Arbeit bieten wir einen alternativen Weg zur Untersuchung von Imply-Discipline-Spielen an, indem wir die Konzepte von Imply-Discipline-korrelierten und grobkorrelierten Gleichgewichten entwickeln. Wir zeigen, dass sie mithilfe von drei klassischen Algorithmen in emph{allen Spielen} effizient gelernt werden können, ohne dass zusätzliche Annahmen über die Struktur des Spiels erforderlich sind. Darüber hinaus stellen wir Korrespondenzen zwischen unseren Vorstellungen und denen her, die bereits in der Literatur vorhanden sind, leiten Optimalitätsgrenzen für den Übergang vom Mittelfeld zum N-Spieler ab und demonstrieren empirisch die Konvergenz dieser Algorithmen bei einfachen Spielen



Source link

HINTERLASSEN SIE EINE ANTWORT

Please enter your comment!
Please enter your name here