Ein bahnbrechender Fortschritt in der Robotik und KI ist entstanden: Ein Roboter, der in der Lage ist, Lego-Konstruktionen nach nur einer einzigen Demonstration zu erlernen. Dieses generalistische Modell, entwickelt von GeneralistAI, steuert zwei Roboterhände in Echtzeit mithilfe eines neuronalen Netzwerks, das mit 100Hz arbeitet. Das System demonstriert bemerkenswerte Fähigkeiten, darunter One-Shot-Assembly, geschickte Manipulation und integriertes Denkvermögen. Der Roboter kann Lego-Strukturen replizieren, nachdem er sie nur einmal gesehen hat, und zeigt dabei Sub-Millimeter-Präzision beim Greifen, Schieben und Ausrichten von Lego-Steinen. Was diesen Ansatz besonders macht, ist die Fähigkeit, übergeordnete Planung (“was zu bauen ist”) mit detaillierter Ausführung (“wie es zu bauen ist”) in einem einzigen Modell zu vereinen – ohne aufgabenspezifischen Code oder spezielle Regeln.
Warum ist das wichtig?
Diese Errungenschaft stellt einen bedeutenden Sprung in Richtung flexiblerer und anpassungsfähigerer Robotik dar. Durch den Nachweis von One-Shot-Learning und generalistischen Fähigkeiten ebnet diese Technologie den Weg für Roboter, die schnell neue Fertigkeiten in verschiedenen Bereichen erwerben können. Die Fähigkeit, komplexe Aufgaben aus minimalen Demonstrationen zu erlernen, könnte Branchen von der Fertigung bis zum Gesundheitswesen revolutionieren und Roboter vielseitiger und einfacher in unterschiedlichen Umgebungen einsetzbar machen. Es ist ein entscheidender Schritt, um die Lücke zwischen eng gefassten, aufgabenspezifischen Robotern und dem Traum von wirklich anpassungsfähigen Mehrzweck-Roboter-Assistenten zu schließen.