Der neueste und unglaublichste Fortschritt im Bereich der künstlichen Intelligenz ist die Entwicklung von Giant Language Fashions (LLMs). Das sehr bekannte, von OpenAI entwickelte ChatGPT, das auf der GPT 3.5- und GPT 4-Architektur basiert, ist von großem Nutzen und steht meist in den Schlagzeilen, wenn es darum geht, Inhalte zu generieren und Fragen zu beantworten, so wie es ein Mensch tun würde. Seine Fähigkeit, Menschen bei der Generierung kreativer und präziser Inhalte nachzuahmen, ermöglicht es ihm, in quick allen Branchen in die Problemlösung einzutauchen. Durch die Hinzufügung von Chain-of-Thought (CoT)-Eingabeaufforderungen haben sich die Auswirkungen von LLMs wie GPT 3.5 verbessert, was zu erheblichen Veränderungen in der Informationsverarbeitungsbranche geführt hat. CoT verbessert die LLMs und hilft ihnen, in einer Reihe von Zwischenschritten umfassendere und ausgefeiltere Argumentationsprozesse zu generieren.
Obwohl CoT viele Vorteile bietet, führt die Betonung der Zwischenphasen des Denkens gelegentlich zu Halluzinationen und zusammengesetzten Fehlern, was es den Modellen erschwert, konsistente und genaue Denkprozesse zu generieren. Es wurden viele Anstrengungen unternommen, um LLMs in die Lage zu versetzen, explizites und rigoroses deduktives Denken anzustellen, indem sie sich von der Artwork und Weise inspirieren ließen, wie Menschen bewusst deduktive logische Denkverfahren anwenden, um Probleme zu lösen. Um diesen Herausforderungen zu begegnen, hat ein Forscherteam das Pure Program eingeführt, ein auf natürlicher Sprache basierendes deduktives Argumentationsformat, das die inhärente Kraft der natürlichen Sprache nutzt, um deduktives Denken zu erreichen.
Das Crew hat erwähnt, dass dieser Ansatz den Prozess der Argumentationsüberprüfung in eine Reihe aufeinanderfolgender Unterprozesse unterteilt. Jedem Unterprozess werden nur der Kontext und die Voraussetzungen bereitgestellt, die für den jeweiligen Schritt erforderlich sind, und die Zerlegung macht den Verifizierungsprozess zugänglicher. Die Autoren haben öffentlich zugängliche Modelle wie GPT-3.5-turbo (175B) von OpenAI verwendet, um Versuche mit Datensätzen für Arithmetik und gesunden Menschenverstand durchzuführen und die Wirksamkeit ihrer natürlichen programmbasierten Verifizierungstechnik zu zeigen. Die Ergebnisse zeigten, wie intestine ihre Strategie funktionierte, um die Zuverlässigkeit der von großen Sprachmodellen erzeugten Argumentationsprozesse zu erhöhen.
Das Pure Program-Format ermöglicht es Sprachmodellen, präzise Argumentationsschritte zu generieren und sicherzustellen, dass nachfolgende Schritte strenger auf früheren Schritten basieren. Mithilfe dieser Struktur führen die Sprachmodelle die Selbstüberprüfung des Denkens Schritt für Schritt durch. Die daraus resultierenden Phasen des Denkens sind strenger und zuverlässiger, da in jede Ebene des deduktiven Denkens ein Überprüfungsverfahren integriert ist.
Einige der wichtigsten Beiträge, die das Crew erwähnt, sind:
- Mit der Einführung des Pure Program-Codecs hat das Crew einen Rahmen für rigoroses deduktives Denken vorgeschlagen, der zur Verifizierung geeignet ist und einfach durch kontextbezogenes Lernen erstellt werden kann.
- Es hat sich gezeigt, dass die langwierigen deduktiven Argumentationsprozesse, die im vorgeschlagenen Pure Program-Format geschrieben sind, zuverlässig selbst verifiziert werden können, indem schrittweise Unterprozesse verwendet werden, die nur den erforderlichen Kontext und die Voraussetzungen abdecken.
- Durch Experimente hat das Crew gezeigt, wie effektiv das Framework die Genauigkeit, Zuverlässigkeit und Interpretierbarkeit von LLM-generierten Argumentationsphasen und -lösungen verbessert.
Zusammenfassend scheint dieser Rahmen vielversprechend für die Verbesserung der deduktiven Argumentationsfähigkeiten von Sprachmodellen zu sein.
Besuche die Papier Und Github. Vergessen Sie nicht, mitzumachen unser 24k+ ML SubReddit, Discord-Kanal, Und E-Mail-Newsletter, wo wir die neuesten Nachrichten aus der KI-Forschung, coole KI-Projekte und mehr teilen. Wenn Sie Fragen zum obigen Artikel haben oder uns etwas entgangen ist, schreiben Sie uns gerne eine E-Mail an Asif@marktechpost.com
Empfohlene Instruments Aus AI Tools Club
🚀 Schauen Sie sich 100 KI-Tools im AI Tools Club an
Tanya Malhotra studiert im letzten Jahr an der College of Petroleum & Power Research in Dehradun und studiert BTech in Informatik mit Spezialisierung auf künstliche Intelligenz und maschinelles Lernen.
Sie ist eine Information-Science-Enthusiastin mit gutem analytischem und kritischem Denken sowie einem großen Interesse daran, sich neue Fähigkeiten anzueignen, Gruppen zu leiten und die Arbeit organisiert zu verwalten.