Figures Helix 02: Ein KI-Gehirn, das endlich den Abwasch macht

Jahrelang waren humanoide Roboter die ungeschickten Teenager der Tech-Welt: Beeindruckend bei choreografierten Tänzen und Backflips, aber hoffnungslos überfordert, sobald sie eine wirklich nützliche Aufgabe im Haushalt übernehmen sollten. Die Robotik-Industrie biss sich seit jeher die Zähne an der sogenannten „Loco-Manipulation“ aus – jener verdammt komplexen Herausforderung, einen Roboter gleichzeitig laufen und seine Hände benutzen zu lassen, ohne dass er in einem Haufen aus Reue und teuren Ersatzteilen in sich zusammensackt.

Auftritt Figure AI mit Helix 02: Ein neues KI-Modell, das nicht nur gleichzeitig laufen und Kaugummi kauen kann. Es läuft, trägt zerbrechliches Geschirr und räumt eine Spülmaschine aus – und das in einer kontinuierlichen, vierminütigen, völlig autonomen Sequenz. Dies ist kein weiterer glattpolierter Kurzzeit-Demo-Clip. Es ist der Beweis, dass ein einziges neuronales Netz einen kompletten humanoiden Körper steuern kann – von den Pixeln der Kamera bis zum Drehmoment der Motoren. Die Lücke zwischen Fortbewegung und Manipulation ist endlich geschlossen.

Das Ende des digitalen Flickenteppichs

Bisher glich die Steuerung eines humanoiden Roboters eher einem digitalen Frankenstein-Monster. Ein Controller war für das Laufen zuständig, übergab dann an ein System für die Stabilisierung, welches wiederum den Staffelstab an ein drittes Modul für das Greifen weiterreichte. Das Ergebnis war ein langsamer, fragiler und zutiefst unnatürlicher Prozess. Wenn sich ein Objekt unerwartet bewegte, stürzte das gesamte logische Kartenhaus in sich zusammen.

„Echte Autonomie erfordert einen fundamental anderen Ansatz: ein einziges lernendes System, das den gesamten Körper als Einheit begreift“, heißt es in der Ankündigung von Figure. „Ein System, das kontinuierlich wahrnimmt, entscheidet und handelt.“

Genau hier setzt Helix 02 an. Anstatt verschiedene Systeme mühsam zusammenzuflicken, hat Figure eine hierarchische KI-Architektur geschaffen, die als geschlossene Einheit denkt und agiert.

Ein dreistufiges Gehirn für einen stählernen Körper

Die Magie hinter Helix 02 verbirgt sich in einer Drei-System-Architektur, bei der jede Ebene in ihrem eigenen Zeittakt arbeitet. Man kann es sich wie eine Unternehmenshierarchie für Gedanken vorstellen – vom CEO, der die Strategie festlegt, bis zum Praktiker, der die eigentliche Arbeit erledigt.

  • System 2 (Der Stratege): Dies ist die Ebene für High-Level-Logik. Sie verarbeitet Szenen und Sprache und bricht einen Befehl wie „Räum die Spülmaschine aus“ in eine Abfolge von Teilzielen herunter. Es arbeitet langsam und behält das große Ganze im Blick.
  • System 1 (Der Taktiker): Dies ist die visuomotorische Policy, die alle Sinne des Roboters – die Kopfkameras, die neuen Kameras in den Handflächen und die taktilen Sensoren in den Fingerspitzen – mit allen Gelenken verbindet. Es übersetzt die Ziele von System 2 in blitzschnelle Ganzkörperbefehle mit einer Frequenz von 200 Hz.
  • System 0 (Der Athlet): Das Fundament. Ein Modell, das mit über 1.000 Stunden menschlicher Bewegungsdaten trainiert wurde. Mit einer Taktrate von 1 kHz sorgt es dafür, dass jede Bewegung stabil, ausbalanciert und natürlich wirkt. In einem beeindruckenden technologischen Kraftakt merkt Figure an, dass System 0 satte 109.504 Zeilen handgeschriebenen C++-Code durch ein einziges neuronales Netz ersetzt. Man hat quasi eine ganze Bibliothek voller Code gefeuert und stattdessen eine KI eingestellt, die durch „Binge-Watching“ von Menschen gelernt hat, wie man sich bewegt.
Video thumbnail

Diese „Pixels-to-whole-body“-Pipeline ermöglicht es dem Roboter, in seinem vierminütigen Spülmaschinen-Ballett 61 verschiedene Loco-Manipulations-Aktionen auszuführen. Er wechselt fließend zwischen Gehen, Tragen und Abstellen – und nutzt sogar seine Hüfte, um eine Schublade zuzudrücken, wenn er gerade alle Hände voll zu tun hat.

Und was kann er jetzt wirklich?

Das Ausräumen der Spülmaschine ist der Star der Show, aber die neue Hardware des Figure 03 Roboters – insbesondere die Handflächenkameras und taktilen Sensoren – eröffnet eine völlig neue Dimension der Geschicklichkeit. Diese Sensoren geben Helix 02 jenes Feedback, das für Aufgaben nötig ist, an denen rein visuelle Systeme bisher scheiterten.

Die taktilen Sensoren registrieren Kräfte von gerade einmal drei Gramm – feinfühlig genug, um eine Büroklammer zu spüren. Das ermöglicht feinmotorische Fähigkeiten einer ganz neuen Klasse.

Geschicklichkeit jenseits des Geschirrs

Helix 02 musste einen Parcours an diffizilen Aufgaben bewältigen, um seine feinmotorische Reife zu beweisen:

  • Einen Flaschendeckel abschrauben: Erfordert präzise, beidhändige Koordination und Kraftkontrolle, damit die Flasche nicht zerquetscht wird.
  • Eine einzelne Pille aus einem Organizer picken: Hier kommen die Kameras in den Handflächen zum Einsatz, wenn die Hauptkameras am Kopf verdeckt sind.
  • Exakt 5 ml mit einer Spritze aufziehen: Eine Aufgabe, die taktiles Feedback verlangt, um einen gleichmäßigen, kontinuierlichen Druck auszuüben.
  • Metallteile aus einer ungeordneten Kiste vereinzeln: Eine reale Aufgabe aus Figures eigener BotQ-Fertigungsanlage, die zeigt, dass das System auch in unordentlichen, unvorhersehbaren Umgebungen funktioniert.

Analyse: Ein Quantensprung für nützliche Humanoide

Während andere Unternehmen Roboter präsentieren, die beeindruckende athletische Kunststücke vollbringen, konzentriert sich Figure auf die unglamouröse, aber entscheidende Herausforderung, Humanoide im Alltag nützlich zu machen. Der Sprung vom ursprünglichen Helix, der nur den Oberkörper steuerte, zur vollständigen Ganzkörper-Autonomie von Helix 02 innerhalb von nur einem Jahr ist ein massives Ausrufezeichen für das Tempo in dieser Branche.

Die wichtigste Erkenntnis: Der Trend geht weg von starren, handcodierten Verhaltensweisen hin zu einem lernenden, anpassungsfähigen System. Indem Figure sein Basismodell mit einem riesigen Datensatz menschlicher Bewegungen trainiert, implementiert es ein natürliches Verständnis dafür, wie ein zweibeiniges Wesen sich bewegen und das Gleichgewicht halten sollte. Dadurch kann sich die übergeordnete KI auf das Was konzentrieren, während das untergeordnete System das Wie übernimmt.

Hier geht es weniger darum, einen Roboter zu bauen, der eine Sache perfekt beherrscht, sondern darum, eine Plattform zu schaffen, die alles lernen kann. Wie Figure-CEO Brett Adcock betonte, können Verbesserungen am neuronalen Netz von Helix direkt auf die gesamte Flotte übertragen werden – jeder Roboter profitiert von den Erfahrungen der anderen. Wenn man bedenkt, dass die Aktuatoren des Roboters derzeit angeblich nur mit 20 bis 25 % ihrer maximalen Geschwindigkeit laufen, ist das Potenzial für Leistungssteigerungen bei der aktuellen Hardware gewaltig.

Noch stehen wir am Anfang, aber das hier ist ein Paradigmenwechsel. Durch die Lösung des Problems der kontinuierlichen Ganzkörper-Autonomie hat Figure einen entscheidenden Schritt in Richtung eines echten Mehrzweck-Roboters gemacht – einer Maschine, die endlich bereit sein könnte, den Abwasch zu übernehmen, ganz ohne Programmier-Voodoo.