- Auf dem Weg zum Multiagenten-Verstärkungslernen mit Quanten-Boltzmann-Maschinen (arXiv)
Autor: Tobias Müller, Christoph Roch, Kyrill Schmid, Philipp Altmann
Zusammenfassung: Reinforcement Studying hat beeindruckende Fortschritte beim maschinellen Lernen vorangetrieben. Gleichzeitig unterliegen quantenverstärkte maschinelle Lernalgorithmen, die Quanten-Annealing nutzen, einer starken Entwicklung. Kürzlich wurde eine Multi-Agent-Reinforcement-Studying-Architektur (MARL) vorgeschlagen, die beide Paradigmen kombiniert. Dieser neuartige Algorithmus, der Quanten-Boltzmann-Maschinen (QBMs) zur Q-Wert-Approximation nutzt, hat das reguläre Deep-Reinforcement-Studying hinsichtlich der zur Konvergenz erforderlichen Zeitschritte übertroffen. Allerdings battle dieser Algorithmus auf Single-Agent- und kleine 2×2-Multi-Agent-Grid-Domänen beschränkt. In dieser Arbeit schlagen wir eine Erweiterung des ursprünglichen Konzepts vor, um anspruchsvollere Probleme zu lösen. Ähnlich wie bei klassischen DQNs fügen wir einen Erfahrungswiedergabepuffer hinzu und verwenden verschiedene Netzwerke zur Annäherung an die Ziel- und Richtlinienwerte. Die experimentellen Ergebnisse zeigen, dass das Lernen stabiler wird und es Agenten ermöglicht, optimale Richtlinien in Grid-Domänen mit höherer Komplexität zu finden. Darüber hinaus bewerten wir, wie sich die gemeinsame Nutzung von Parametern auf das Agentenverhalten in Multiagentendomänen auswirkt. Quantensampling erweist sich als vielversprechende Methode für Reinforcement-Studying-Aufgaben, ist jedoch derzeit durch die QPU-Größe und damit durch die Größe der Eingabe und der Boltzmann-Maschine begrenzt.
2. Gruppentheorie zur Quanten-Boltzmann-Maschine (arXiv)
Autor: Hai-jing-Lied, DL Zhou
Zusammenfassung: Die Gruppentheorie ist äußerst erfolgreich bei der Charakterisierung der Symmetrien in Quantensystemen, was unsere Behandlung von Quantensystemen erheblich vereinfacht und vereinheitlicht. Hier stellen wir das Konzept der Symmetrie für eine Quanten-Boltzmann-Maschine vor und entwickeln eine Gruppentheorie zur Beschreibung der Symmetrie. Diese Symmetrie impliziert nicht nur, dass alle Zielzustände im Zusammenhang mit den Symmetrietransformationen äquivalent sind, sondern auch, dass für einen gegebenen Zielzustand alle optimalen Lösungen im Zusammenhang mit den Symmetrietransformationen, die den Zielzustand invariant halten, äquivalent sind. Für die auf Qubits aufgebauten Boltzmann-Maschinen schlagen wir ein systematisches Verfahren zur Konstruktion der Gruppe vor und entwickeln einen numerischen Algorithmus, um die Vollständigkeit unserer Konstruktion zu überprüfen.