Generalists GEN-1: 99 % Erfolg & 3x Speed für die Robotik

Seien wir ehrlich: Die meisten Roboter-Demos sind ein sorgfältig choreografiertes Ballett der Enttäuschung. Man beobachtet quälend langsame, unbeholfene Bewegungen und fragt sich unweigerlich, ob der Wärmetod des Universums eintritt, bevor die Maschine ihre Aufgabe erledigt hat. Doch hin und wieder gibt es Innovationen, die dieses Grundrauschen durchbrechen. Heute ist so ein Tag: Generalist hat sein neues KI-Modell GEN-1 vorgestellt. Und das Unternehmen klotzt statt zu kleckern: Man präsentiere nichts Geringeres als ein universelles KI-Gehirn für Roboter, das einfache physische Aufgaben nicht nur bewältigt, sondern regelrecht meistert.

Generalist preist GEN-1 als das erste Modell an, das alltägliche Handgriffe wirklich „beherrscht“ – und liefert die Belege gleich mit. Wir sprechen hier von einer durchschnittlichen Erfolgsquote von 99 % bei Aufgaben, bei denen das Vorgängermodell GEN-0 mit einer eher mäßigen „Note 3“ von 64 % abschnitt. Zudem arbeitet GEN-1 bis zu dreimal schneller als der bisherige Stand der Technik. Der Clou: Um eine völlig neue Aufgabe zu erlernen, benötigt das Modell lediglich etwa eine Stunde roboter-spezifischer Daten. Das ist kein inkrementelles Update; das ist ein potenzieller Phasenwechsel hin zu Robotern, die endlich, wirklich kommerziell rentabel sind.

Von Scaling Laws zur physischen Meisterschaft

Vor gerade einmal fünf Monaten präsentierte Generalist GEN-0. Es war der erste echte Beweis dafür, dass die „Scaling Laws“ – jene Skalierungseffekte, die den kometenhaften Aufstieg von Large Language Models wie GPT ermöglicht haben – auch in der Robotik greifen. Mehr Daten und mehr Rechenleistung führten zu vorhersagbar besseren, generalisierteren Ergebnissen. Das war ein wichtiger akademischer Meilenstein, aber GEN-0 war noch nicht reif für den harten Praxiseinsatz.

GEN-1 ist das Ergebnis, wenn man diese Regler bis zum Anschlag aufdreht. Das Modell wurde mit einem weitaus größeren Datensatz trainiert – mittlerweile über eine halbe Million Stunden hochpräziser physischer Interaktionsdaten – und durch neue algorithmische Fortschritte beschleunigt. Die Geheimzutat ist jedoch die Datenquelle selbst. Statt sich nur auf teure und schwer skalierbare Teleoperations-Datensätze zu verlassen, basiert das Fundament von GEN-1 auf Daten von kostengünstigen Wearables, die von Menschen getragen werden. Dies liefert einen reichhaltigen Pre-Training-Korpus aus realer Physik und intuitiven Mikro-Korrekturen, die in Simulationen oder bei der Fernsteuerung oft verloren gehen.

„Wir glauben, dass GEN-1 das erste allgemeine physische KI-Modell ist, das eine entscheidende Schwelle überschreitet: Die kommerzielle Nutzbarkeit für ein breites Spektrum an Aufgaben“, hieß es in der Ankündigung des Unternehmens.

Ein Roboterarm verpackt präzise ein Smartphone in einen Karton – ein Beweis für Hochgeschwindigkeits-Präzision.

Die heilige Dreifaltigkeit: Zuverlässigkeit, Speed und Improvisation

Generalist definiert „Meisterschaft“ als die Kombination aus drei Schlüsselfähigkeiten. Zwei davon sind seit 60 Jahren das Fundament der industriellen Automatisierung. Es ist jedoch die dritte, die alles verändert.

Zuverlässigkeit und Speed: Der Turbo für den Industriestandard

Zunächst einmal sind die nackten Zahlen beeindruckend. In Langzeittests packte GEN-1 über 1.800 Mal hintereinander Blöcke ein, faltete über 200 Kartons und wartete sogar über 200 Mal in Folge einen Saugroboter – ein Roboter, der einen anderen Roboter instand hält; wahlweise ein technologischer Traum oder der Anfang eines sehr spezifischen Horrorfilms. Diese Aufgaben liefen stundenlang ohne menschliches Eingreifen mit einer Erfolgsquote von 99 %.

Und dann ist da das Tempo. Roboter mit GEN-1-Power können einen Karton in 12,1 Sekunden zusammenbauen – eine Aufgabe, für die der Vorgänger noch rund 34 Sekunden brauchte. Das Einlegen eines Telefons in eine Hülle ist in 15,5 Sekunden erledigt, 2,8-mal schneller als bisher. Dabei geht es nicht nur darum, die Motoren schneller drehen zu lassen; das Modell lernt aus Erfahrung und nutzt fortschrittliche Inferenztechniken, um Aufgaben effizienter auszuführen als die menschlichen Vorbilder, von denen es gelernt hat.

Video thumbnail

Improvisation: Der Funke Intelligenz

Zuverlässigkeit und Geschwindigkeit sind Standard für Industriearme, die fest mit dem Fabrikboden verschraubt sind. Was ihnen fehlt, ist die Fähigkeit, mit der beharrlichen Weigerung des Universums umzugehen, sich an das Drehbuch zu halten. Hier kommt die „improvisatorische Intelligenz“ von GEN-1 ins Spiel.

Generalist beschreibt dies als eine emergente Fähigkeit, eine Art „Freestyle-Problemlösung“. In einer Demo stößt ein Roboter beim Sortieren von Autoteilen versehentlich gegen eine Unterlegscheibe. Anstatt einzufrieren oder die Aufgabe abzubrechen, analysiert das GEN-1-System die Situation und passt sich an. Er setzt die Scheibe vielleicht kurz ab, um sie sauberer zu greifen, nutzt geschickt die Kante eines Schlitzes, um das Teil neu auszurichten, oder setzt sogar die zweite Hand für eine beidhändige Korrektur ein. Das sind keine vorprogrammierten Fehlerbehebungs-Routinen; es sind neue, spontan generierte Lösungen, die weit außerhalb der Trainingsverteilung liegen. Das ist der entscheidende Unterschied zwischen Automatisierung und echter Autonomie.

Mehr als ein Modell: Ein komplettes System

Man muss verstehen, dass GEN-1 nicht bloß ein Satz von Modellgewichten ist. Es ist ein komplettes System, das Innovationen im Pre-Training, Post-Training-Techniken und der Verarbeitung während der Inferenz vereint. Dieser systemorientierte Ansatz macht es so dateneffizient: GEN-1 kann sich gleichzeitig an einen neuen Roboterkörper und eine neue Aufgabe anpassen – und das mit nur etwa einer Stunde an neuen Daten.

Ein Roboterarm bei der Wartung eines Saugroboters – komplexe Interaktion zwischen zwei Maschinen.

Natürlich ist GEN-1 keine eierlegende Wollmilchsau für eine physische AGI. Das Unternehmen weist selbst auf die Grenzen hin: Nicht alle Aufgaben erreichen sofort diese 99-Prozent-Marke, und manche Industrieanwendungen verlangen eine noch höhere Ausfallsicherheit. Zudem wirft die emergente Improvisationsfähigkeit die kritische Frage nach dem AI Alignment auf. Ein Roboter, der Probleme kreativ löst, ist fantastisch – solange man sicherstellt, dass seine „kreative Lösung“ nicht darin besteht, aus Effizienzgründen ein Loch in die Wand zu schlagen.

Zwei Roboterarme falten gemeinsam ein T-Shirt – eine klassische Herausforderung für die Feinmotorik.

Dennoch fühlt sich der Launch von GEN-1 wie ein echter Meilenstein an. Er untermauert das Argument, dass die Skalierung von Modellen mit gewaltigen Mengen an physischen Interaktionsdaten aus der realen Welt der vielversprechendste Weg zu Generalist-Robotern ist. Indem das Unternehmen auf das Dreigestirn der Performance setzt – die Aufgabe korrekt erledigen, sie schnell erledigen und wissen, was zu tun ist, wenn etwas schiefgeht –, könnte Generalist den Traum vom nützlichen Universalroboter gerade ein gewaltiges Stück näher an die Realität gerückt haben. Für uns ist das mehr als nur ein neues Modell; es ist ein Zeichen dafür, dass die physische Welt endlich ein ganzes Stück intelligenter wird.