In einem Schritt, der in der Robotik-Community gleichermaßen für Euphorie wie für Schweißperlen auf der Stirn sorgen dürfte, hat NVIDIA das Modell SONIC als Open Source veröffentlicht. Dabei handelt es sich um ein Foundation Model, das darauf ausgelegt ist, humanoiden Robotern endlich mehr beizubringen als nur schicke, vorprogrammierte Akrobatik. Das Ziel, wie NVIDIA-Forscher Yuke Zhu es formuliert: Der Fokus der Branche soll weg von agilen, aber starren Bewegungsabläufen und hin zu „Generalisten-Humanoiden, die echte Arbeit verrichten“. Lassen Sie das kurz sacken: echte Arbeit.
SONIC – kurz für Supersizing mOtion tracking for Natural humanoId Control – ist ein „Behavior Foundation Model“ für die Ganzkörper-Bewegungssteuerung in Echtzeit. Trainiert wurde es mit einem gewaltigen Datensatz von über 100 Millionen Frames aus menschlichen Motion-Capture-Aufnahmen. Das sind mehr als 700 Stunden, in denen Menschen rennen, springen und krabbeln, um Robotern ein grundlegendes Verständnis für natürliche Bewegungsabläufe zu vermitteln – und das ganz ohne mühsames, aufgabenspezifisches „Reward Engineering“. Das System unterstützt sowohl die direkte Fernsteuerung via Teleoperation als auch die Steuerung durch Vision-Language-Action (VLA) Modelle. Damit kann eine einzige, vereinheitlichte Policy den gesamten Roboter kontrollieren.
Und das Ganze scheint nicht nur graue Theorie zu sein. Ein Beta-Tester berichtete, dass er das System innerhalb weniger Stunden einsatzbereit hatte und bezeichnete die Performance als „überlegen“. In einem Feld, in dem man normalerweise Monate mit dem feinteiligen Tuning von Controllern verbringt, grenzt eine Einrichtungszeit von wenigen Stunden fast schon an ein Wunder.
Warum ist das so wichtig?
Jahrelang steckte die humanoide Robotik in einer Art „Demo-Endlosschleife“ fest: Man präsentierte beeindruckende, aber höchst fragile Kunststücke, die sich kaum auf praktische Anwendungen übertragen ließen. Indem NVIDIA nun einen leistungsstarken Generalisten-Controller als Open Source zur Verfügung stellt, wird die Basistechnologie für humanoide Bewegungen quasi zur Standardware. Das senkt die Einstiegshürden für Startups und Forscher massiv. Sie müssen das Rad – oder in diesem Fall das Roboterbein – nicht jedes Mal neu erfinden, sondern können sich auf komplexere Aufgaben wie logisches Denken und die tatsächliche Ausführung von Tätigkeiten konzentrieren.
Es ist ein strategischer Schachzug, der eng mit NVIDIAs größerem Project GR00T (Generalist Robot 00 Technology) verknüpft ist, um eine standardisierte Software- und KI-Plattform für die nächste Roboter-Generation zu etablieren. Die Ära der Rückwärtssaltos für Klicks neigt sich damit dem Ende zu. Sie wird ersetzt durch die weitaus unspektakulärere – aber unendlich wertvollere – Ära von Robotern, die tatsächlich den Abwasch erledigen können.













