Wie korrelierte Gleichgewichte funktionieren Teil 1 (Informatik) | von Monodeep Mukherjee | Juni 2023

0
21


  1. Bayes-korrelierte Gleichgewichte und No-Remorse-Dynamik (arXiv)

Autor: Kaito Fujii

Zusammenfassung: In diesem Artikel werden Gleichgewichtskonzepte für Bayes’sche Spiele untersucht, bei denen es sich um grundlegende Modelle von Spielen mit unvollständiger Info handelt. Wir zielen auf drei wünschenswerte Eigenschaften von Gleichgewichten ab. Erstens können Gleichgewichte auf natürliche Weise durch die Einführung eines Mediators in Spiele erreicht werden. Zweitens kann ein Gleichgewicht auf verteilte Weise effizient berechnet werden. Drittens maximiert jedes Gleichgewicht in dieser Klasse ungefähr den sozialen Wohlstand, gemessen am Preis der Anarchie, für eine breite Klasse von Spielen. Diese drei Eigenschaften ermöglichen es den Spielern, ein Gleichgewicht zu berechnen und über einen Mediator zu realisieren und so einen stabilen Zustand mit annähernd optimaler sozialer Wohlfahrt zu erreichen. Unser Hauptergebnis ist die Existenz eines Gleichgewichtskonzepts, das diese drei Eigenschaften erfüllt. Zu diesem Zweck charakterisieren wir verschiedene (nicht äquivalente) Erweiterungen korrelierter Gleichgewichte, die zusammen als Bayes-korrelierte Gleichgewichte bekannt sind. Insbesondere konzentrieren wir uns auf Kommunikationsgleichgewichte (auch Koordinationsmechanismen genannt), die durch einen Mediator realisiert werden können, der die privaten Informationen jedes Spielers sammelt und dann entsprechende Empfehlungen an die Spieler sendet. Wir zeigen, dass die empirische Verteilung dieser Dynamiken zu einem Kommunikationsgleichgewicht konvergiert, wenn jeder Spieler beim wiederholten Spielen von Bayes’schen Spielen eine Variante des Bedauerns minimiert, die als unwahres Tausch-Bedauern bezeichnet wird. Wir präsentieren einen effizienten Algorithmus zur Minimierung unwahren Swap-Bedauerns mit einer sublinearen Obergrenze, die wir bis zu einer multiplikativen Konstante als eng beweisen. Dadurch können wir durch die Simulation der Dynamik mit unserem Algorithmus effizient ein ungefähres Kommunikationsgleichgewicht berechnen. Darüber hinaus erweitern wir bestehende Untergrenzen für den Preis der Anarchie, die auf den Glätteargumenten von Bayes-Nash-Gleichgewichten basieren, auf Gleichgewichte, die durch die vorgeschlagene Dynamik erhalten werden.

2. Lernen dichtebasierter korrelierter Gleichgewichte für Markov-Spiele (arXiv)

Autor: Libo Zhang, Yang Chen, Toru Takisaka, Bakh Khoussainov, Michael Witbrock, Jiamou Liu

Zusammenfassung: Corlated Equilibrium (CE) ist ein etabliertes Lösungskonzept, das die Koordination zwischen Agenten erfasst und über gute algorithmische Eigenschaften verfügt. In realen Multiagentensystemen wird häufig erwartet, dass die Richtlinien der Agenten nicht nur im Gleichgewicht sind, sondern auch Anforderungen in Bezug auf Sicherheit und Equity erfüllen. Solche zusätzlichen Anforderungen können oft in Type der Zustandsdichte ausgedrückt werden, die die Häufigkeit der Staatsbesuche im Verlauf eines Spiels misst. Bestehende CE-Vorstellungen oder CE-Findungsansätze können jedoch kein CE explizit mit bestimmten Eigenschaften bezüglich der Zustandsdichte spezifizieren; Sie tun dies implizit, indem sie entweder Belohnungsfunktionen modifizieren oder Wertfunktionen als Auswahlkriterien verwenden. Das resultierende CE erfüllt daher möglicherweise nicht vollständig die Anforderungen an die Zustandsdichte. In diesem Artikel schlagen wir Density-Primarily based Corlated Equilibria (DBCE) vor, ein neues Konzept von CE, das explizit die Zustandsdichte als Auswahlkriterium berücksichtigt. Konkret instanziieren wir DBCE, indem wir unterschiedliche Anforderungen an die Zustandsdichte spezifizieren, die durch reale Anwendungen motiviert sind. Um DBCE zu berechnen, schlagen wir den Density Primarily based Corlated Coverage Iteration-Algorithmus für das zugrunde liegende Kontrollproblem vor. Wir führen Experimente zu verschiedenen Spielen durch, deren Ergebnisse den Vorteil unseres CE-Ermittlungsansatzes gegenüber bestehenden Methoden in Szenarien mit Bedenken hinsichtlich der Zustandsdichte zeigen.



Source link

HINTERLASSEN SIE EINE ANTWORT

Please enter your comment!
Please enter your name here