Können LLMs mathematische Beweise generieren, die streng überprüft werden können? Lernen Sie LeanDojo kennen: einen Open-Source-KI-Spielplatz mit Toolkits, Benchmarks und Modellen für große Sprachmodelle zum Beweis formaler Theoreme im Lean Proof Assistant

0
22


Künstliche Intelligenz und maschinelles Lernen sind die Trendfelder der heutigen Zeit. Angesichts der immensen Fortschritte in der KI verändern neue Innovationen die Artwork und Weise, wie Menschen mit Maschinen interagieren. Das Denken in der menschlichen Intelligenz ist ein wesentlicher Teil der künstlichen Intelligenz. Es wurden eine Reihe von Ansätzen zum Beweisen von Theoremen erforscht, beispielsweise das Automated Theorem Proving (ATP), bei dem es sich um den Prozess der automatischen Erstellung von Beweisen für in der formalen Logik dargelegte Theoreme handelt. Da ATP aufgrund des riesigen Suchraums eine Herausforderung darstellt, entwickelte sich die interaktive Theoremprüfung (ITP) zu einem alternativen Paradigma, bei dem menschliche Experten mit Softwaretools, sogenannten Beweisassistenten, interagieren, um Beweise zu konstruieren.

Große Sprachmodelle (LLMs), die bemerkenswerte Fähigkeiten zur Codegenerierung gezeigt haben, haben aufgrund von Fehlern in der Faktizität und Halluzination ebenfalls Schwierigkeiten bei der Beweisführung von Theoremen. Um diese Einschränkungen zu überwinden, hat ein Forscherteam von Caltech, NVIDIA, MIT, UC Santa Barbara und UT Austin LeanDojo eingeführt, ein Open-Supply-Toolkit für LLM-basierte Theorembeweise. LeanDojo basiert auf dem Lean-Beweisassistenten, der bei Mathematikern beliebt ist. Es bietet Ressourcen für die Arbeit mit Lean und das Extrahieren von Daten.

Bei der Datenextraktion werden Trainingsdaten aus Beweisbäumen und Zwischenbeweiszuständen gesammelt, die im ursprünglichen Lean-Code nicht sofort erkennbar sind. LeanDojo wurde in die Lage versetzt, Modellen die programmgesteuerte Kommunikation mit Lean zu ermöglichen. Dadurch können sie den Proof-Standing einsehen, Proof-Aktionen oder -Taktiken durchführen und Suggestions von Lean erhalten. Der Open-Supply-Lean-Spielplatz besteht aus zahlreichen Elementen, darunter Toolkits, Daten, Modelle und Benchmarks, um eine programmierte Interaktion mit der Proof-Umgebung zu ermöglichen und Daten aus Lean zu extrahieren.

LeanDojo bietet feinkörnige Anmerkungen zu Prämissen in Beweisen, was für die Auswahl von Prämissen wertvoll ist, einem kritischen Engpass beim Beweisen von Theoremen. Mithilfe der Datenextraktionsfunktionen von LeanDojo haben die Forscher außerdem ReProver entwickelt, den ersten LLM-basierten Beweiser mit erweiterter Retrieval-Funktion zur Auswahl von Prämissen aus einer großen Mathematikbibliothek. Im Gegensatz zu früheren Methoden, die auf privaten Datensätzen beruhten und erhebliche Rechenressourcen erforderten, wurde ReProver so konzipiert, dass es zugänglicher und kostengünstiger ist. Es benötigt weniger Rechenleistung und kann mit nur einer GPU professional Woche trainiert werden.

Die Programmanalysekapazität von LeanDojo wurde vom ReProver-Abrufmechanismus genutzt, um zugängliche Räumlichkeiten zu finden und konkrete Beispiele dafür zu liefern, was schief gehen könnte. Dadurch erzielt der Prüfer eine bessere Leistung und das Abrufverfahren ist effektiver. Zur Auswertung und weiteren Forschung hat das Workforce einen neuen Benchmark-Datensatz entwickelt, der 96.962 Theoreme und Beweise aus der Mathematikbibliothek von Lean umfasst. Dieser Benchmark-Datensatz weist eine anspruchsvolle Datenaufteilung auf, die vom Prüfer eine Verallgemeinerung auf Theoreme erfordert, die auf neuartigen Prämissen basieren, die während des Trainings nicht verwendet wurden. Die experimentellen Ergebnisse haben gezeigt, dass ReProver im Vergleich zu Nicht-Abruf-Basislinien und GPT-4 eine gute Leistung erbringt, wenn dieser Benchmark-Datensatz für Coaching und Bewertung verwendet wird.

Zusammenfassend lässt sich sagen, dass diese Open-Supply-Lösung für den LLM-basierten Theorembeweis vielversprechend für die Zukunft ist. Es überwindet die Barrieren von privatem Code, Daten und großen Rechenanforderungen, indem es zugängliche Toolkits, Daten, Modelle und Benchmarks bereitstellt.


Besuche die Papier, Github-Link, Und Projektseite. Vergessen Sie nicht, mitzumachen unser 25k+ ML SubReddit, Discord-Kanal, Und E-Mail-Newsletter, wo wir die neuesten Nachrichten aus der KI-Forschung, coole KI-Projekte und mehr teilen. Wenn Sie Fragen zum obigen Artikel haben oder uns etwas entgangen ist, schreiben Sie uns gerne eine E-Mail an Asif@marktechpost.com


Empfohlene Instruments:

🚀 Schauen Sie sich 100 KI-Tools im AI Tools Club an


Tanya Malhotra studiert im letzten Jahr an der College of Petroleum & Power Research in Dehradun und studiert BTech in Informatik mit Spezialisierung auf künstliche Intelligenz und maschinelles Lernen.
Sie ist eine Knowledge-Science-Enthusiastin mit gutem analytischem und kritischem Denken sowie einem großen Interesse daran, sich neue Fähigkeiten anzueignen, Gruppen zu leiten und die Arbeit organisiert zu verwalten.




Source link

HINTERLASSEN SIE EINE ANTWORT

Please enter your comment!
Please enter your name here