Die Branche der künstlichen Intelligenz hat in letzter Zeit die Welt erobert. Da quick täglich neue und einzigartige Forschungsergebnisse und Modelle veröffentlicht werden, entwickelt sich die KI weiter und wird besser. Ganz gleich, ob wir das Gesundheitswesen, die Bildung, das Advertising oder die Wirtschaft betrachten: Künstliche Intelligenz und maschinelles Lernen beginnen, die Arbeitsweise von Branchen zu verändern. Die Einführung von Giant Language Fashions (LLMs), einem bekannten Fortschritt in der KI, wird von quick jeder Organisation übernommen. Berühmte LLMs wie GPT-3.5 und GPT-4 haben eine beeindruckende Anpassungsfähigkeit an neue Kontexte bewiesen und ermöglichen Aufgaben wie logisches Denken und Codegenerierung mit einer minimalen Anzahl handgefertigter Beispiele.
Forscher haben auch den Einsatz von LLMs zur Verbesserung der Robotersteuerung im Bereich Robotik untersucht. Da Roboteroperationen auf niedriger Ebene hardwareabhängig sind und in LLM-Trainingsdaten häufig unterrepräsentiert sind, ist die Anwendung von LLMs auf die Robotik schwierig. Frühere Ansätze betrachteten LLMs entweder als semantische Planer oder verließen sich auf von Menschen erstellte Kontrollprimitive, um mit Robotern zu kommunizieren. Um alle Herausforderungen zu bewältigen, haben Forscher von Google DeepMind ein neues Paradigma eingeführt, das die Anpassungsfähigkeit und das Optimierungspotenzial von Belohnungsfunktionen nutzt, um eine Vielzahl von Roboteraktivitäten auszuführen.
Belohnungsfunktionen fungieren als definierte Zwischenschnittstellen der LLMs, die später optimiert werden können, um Robotersteuerungsstrategien zu steuern. Diese Funktionen eignen sich aufgrund ihres semantischen Reichtums für die Spezifikation durch LLMs, da sie Sprachbefehle oder Korrekturen auf hoher Ebene effizient mit Roboterverhalten auf niedriger Ebene verbinden können. Das Workforce hat erwähnt, dass die Arbeit auf einer höheren Abstraktionsebene unter Verwendung von Belohnungsfunktionen als Schnittstelle zwischen Sprache und Roboteraktionen auf niedriger Ebene von der Beobachtung inspiriert wurde, dass Anweisungen in menschlicher Sprache häufig Verhaltensergebnisse und nicht bestimmte Aktionen auf niedriger Ebene beschreiben. Durch die Verknüpfung von Anweisungen mit Belohnungen wird es einfacher, die Lücke zwischen Sprache und Roboterverhalten zu schließen, da Belohnungen die Tiefe der Semantik erfassen, die mit den gewünschten Ergebnissen verbunden ist.
Der Echtzeitoptimierer MuJoCo MPC (Mannequin Predictive Management) wurde in diesem Paradigma verwendet, um eine interaktive Verhaltensentwicklung zu ermöglichen. Der iterative Verfeinerungsprozess wurde dadurch verbessert, dass der Benutzer die Ergebnisse sofort beobachten und die Systemeingaben bereitstellen kann. Für den Bewertungsprozess entwarf das Forscherteam einen Satz von 17 Aufgaben sowohl für einen simulierten Vierbeinerroboter als auch für einen geschickten Manipulatorroboter. Die Methode konnte 90 % der vorgesehenen Aufgaben mit zuverlässig guter Leistung erledigen. Im Gegensatz dazu wurden mit einer Basisstrategie, die primitive Fähigkeiten als Schnittstelle zu Code-as-Insurance policies nutzt, nur 50 % der Aufgaben erledigt. Um die Effizienz der Methodik zu testen, wurden auch Experimente an einem echten Roboterarm durchgeführt, bei denen das interaktive System komplexe Manipulationsfähigkeiten zeigte, wie z. B. nicht greifbares Schieben.
Zusammenfassend lässt sich sagen, dass dies ein vielversprechender Ansatz ist, mit dessen Hilfe LLMs genutzt werden können, um Belohnungsparameter zu definieren und diese für die Robotersteuerung zu optimieren. Die Kombination aus LLM-generierten Belohnungen und Echtzeit-Optimierungstechniken stellt einen interaktiven und rückkopplungsgesteuerten Verhaltenserstellungsprozess dar, der es Benutzern ermöglicht, komplexe Roboterverhalten effizienter und effektiver zu erreichen.
Besuche die Papier Und Projekt. Vergessen Sie nicht, mitzumachen unser 25k+ ML SubReddit, Discord-Kanal, Und E-Mail-Newsletter, wo wir die neuesten Nachrichten aus der KI-Forschung, coole KI-Projekte und mehr teilen. Wenn Sie Fragen zum obigen Artikel haben oder uns etwas entgangen ist, schreiben Sie uns gerne eine E-Mail an Asif@marktechpost.com
Empfohlene Instruments Aus AI Tools Club
🚀 Schauen Sie sich 100 KI-Tools im AI Tools Club an
Tanya Malhotra studiert im letzten Jahr an der College of Petroleum & Vitality Research in Dehradun und studiert BTech in Informatik mit Spezialisierung auf künstliche Intelligenz und maschinelles Lernen.
Sie ist eine Knowledge-Science-Enthusiastin mit gutem analytischem und kritischem Denken sowie einem großen Interesse daran, sich neue Fähigkeiten anzueignen, Gruppen zu leiten und die Arbeit organisiert zu verwalten.