- GeoGauss: Stark konsistentes und leicht koordiniertes OLTP für georeplizierte SQL-Datenbanken (arXiv)
Autor: Weixing Zhou, Qi Peng, Zijie Zhang, Yanfeng Zhang, Yang Ren, Sihao Li, Guo Fu, Yulong Cui, Qiang Li, Caiyi Wu, Shangjun Han, Shengyi Wang, Guoliang Li, Ge Yu
Zusammenfassung: Multinationale Unternehmen betreiben globale Geschäfte, die einen Bedarf an geografisch verteilten Transaktionsdatenbanken haben. Bestehende hochmoderne Datenbanken verwenden eine Shard-Grasp-Follower-Replikationsarchitektur. Der Single-Grasp-Bereitstellungsmodus erfordert jedoch umfangreiche regionsübergreifende Schreibvorgänge von Purchasers, und die Shard-Architektur erfordert mehrere Roundtrip-Bestätigungen (z. B. 2PC), um die Atomizität für Shard-übergreifende Transaktionen sicherzustellen. Diese Einschränkungen veranlassen uns, nach einer weiteren Designauswahl zu suchen. In diesem Artikel schlagen wir eine stark konsistente OLTP-Datenbank GeoGauss mit vollständiger Replikat-Multi-Grasp-Architektur vor. Um die Aktualisierungen verschiedener Masterknoten effizient zusammenzuführen, schlagen wir einen Multi-Grasp-OCC vor, der die Datenreplikation und die gleichzeitige Transaktionsverarbeitung vereinheitlicht. Durch die Nutzung einer epochenbasierten Delta-State-Merge-Regel und der optimistischen asynchronen Ausführung gewährleistet GeoGauss eine starke Konsistenz mit leicht koordinierten Protokollen und ermöglicht mehr Parallelität bei schwacher Isolation, die ausreicht, um unsere Anforderungen zu erfüllen. Unsere geoverteilten experimentellen Ergebnisse zeigen, dass GeoGauss beim TPC-C-Benchmark einen 7,06-mal höheren Durchsatz und eine 17,41-mal geringere Latenz als die hochmoderne geoverteilte Datenbank CockroachDB erreicht
2.Planung von OLTP-Transaktionen über maschinelles Lernen (arXiv)
Autor: Yangjun Sheng, Anthony Tomasic, Tieying Zhang, Andrew Pavlo
Zusammenfassung: Aktuelle Hauptspeicher-Datenbanksystemarchitekturen stehen immer noch vor der Herausforderung hoher Konkurrenzlasten, und diese Herausforderung wird weiter zunehmen, da die Anzahl der Kerne in Prozessoren weiter zunimmt. Diese Systeme planen Transaktionen nach dem Zufallsprinzip über die Kerne hinweg, um die Parallelität zu maximieren und eine gleichmäßige Final über alle Kerne hinweg zu erzeugen. Bei der Planung werden potenzielle Konflikte niemals berücksichtigt. Die Leistung könnte verbessert werden, wenn bei der Planung ein Gleichgewicht zwischen Parallelität zur Maximierung des Durchsatzes und linearer Planung von Transaktionen zur Vermeidung von Konflikten geschaffen würde. In diesem Artikel stellen wir den Entwurf mehrerer intelligenter Transaktionsplanungsalgorithmen vor, die sowohl potenzielle Transaktionskonflikte als auch Parallelität berücksichtigen. Um Überlegungen zu Transaktionskonflikten einzubeziehen, entwickeln wir ein überwachtes maschinelles Lernmodell, das die Wahrscheinlichkeit von Konflikten abschätzt. Dieses Modell ist in mehrere Planungsalgorithmen integriert. Darüber hinaus integrieren wir einen unbeaufsichtigten maschinellen Lernalgorithmus in einen intelligenten Planungsalgorithmus. Anschließend messen wir empirisch die Leistungsauswirkungen verschiedener Planungsalgorithmen auf OLTP- und Social-Networking-Workloads. Unsere Ergebnisse zeigen, dass intelligente Planung bei geeigneten Einstellungen den Durchsatz um 54 % steigern und die Abbruchrate auf einem 20-Kern-Laptop im Vergleich zur zufälligen Planung um 80 % senken kann. Zusammenfassend liefert das Papier vorläufige Beweise dafür, dass intelligente Planung die DBMS-Leistung erheblich verbessert.