Roboter-Training: Mensch gegen YouTube

Der Wettlauf um den Bau eines fähigen humanoiden Roboters mutiert zusehends von einer Materialschlacht zu einer grundlegenden philosophischen Frage: Wie bringt man einer Maschine am besten etwas bei? Auf der einen Seite haben wir Unternehmen wie Sunday, die auf eine Armee menschlicher Lehrmeister setzen. Auf der anderen Seite hoffen Giganten wie Tesla und Nvidia, dass ihre Roboter allein durch das Anschauen von YouTube-Videos lernen können. Diese strategische Spaltung definiert das gesamte Spiel, und niemand ist sich über die einzig richtige Antwort einig.

Sunday setzt voll auf Imitationslernen und stattet 500 “Memory Developer” mit speziellen Handschuhen aus, um akribisch hochwertige Daten für jede erdenkliche Aufgabe aufzuzeichnen. Das Unternehmen behauptet, diese Methode ermögliche es ihm, alle ein bis zwei Wochen eine neue Aufgabe zu trainieren und zu evaluieren, und so den nach eigenen Angaben “schnellsten lernenden Roboter der Welt” zu erschaffen. Es ist ein handwerklicher, beinahe künstlerischer Ansatz zur Datenerfassung, der Qualität über bloße Quantität stellt.

Video thumbnail

Dieses menschenzentrierte Modell hat Varianten. Das norwegische Unternehmen 1X Technologies setzt ebenfalls auf menschliche Führung, doch anstatt Handschuhe und kuratierte Sitzungen zu nutzen, setzt es seine 1X Neo: Ihr KI-Butler ist da, für einen Preis Roboter direkt in realen Szenarien ein, wo sie über Teleoperation lernen. Weniger Hörsaal, mehr Praxisschulung direkt am Fließband der Realität. Währenddessen baut Figure physische “Neura Gyms” auf – strukturierte Umgebungen, in denen seine Roboter an spezifischen Aufgaben trainieren können, manchmal in Partnerschaft mit Unternehmen wie BMW.

Dann gibt es noch die “einfach Videos anschauen”-Fraktion. Tesla hat sein Ziel lautstark verkündet, dass der Optimus-Bot Aufgaben einfach durch das Beobachten von Videos lernen soll, in denen Menschen diese Aufgaben ausführen. Nvidia wiederum nutzt mit seiner NVIDIA baut eine Matrix für Roboter mit Cosmos Plattform ebenfalls Simulationen und riesige, internetweite Videodaten, um seine Grundmodelle für die Robotik zu trainieren. Diese Methode verspricht eine immense Skalierbarkeit – es gibt online mehr Stunden an “How-to”-Videos, als jedes Team von Memory Developern jemals produzieren könnte – doch sie kämpft mit dem Kontext, der physischen Verkörperung und dem schieren, datenmüllartigen Rauschen unstrukturierter Informationen.

Warum ist das wichtig?

Der Riss in der Trainingsmethodologie stellt die ultimative Hürde dar, um einen wirklich universellen Roboter zu erschaffen. Der Kern der Debatte ist ein klassisches Problem von Qualität versus Quantität, verstärkt durch die Komplexität physischer Interaktion.

Ist ein akribisch kuratierter, hochwertiger Datensatz von menschlichen Demonstratoren – wie ihn Sunday AI: Roboter-Puppen übersprungen, Hausarbeit per Hand lehren aufbaut – der Schlüssel zu zuverlässiger Aufgabenausführung? Oder wird die schiere, chaotische Menge an Internetdaten letztlich einen robusteren und skalierbareren Weg zur Intelligenz ebnen, wie Tesla und Nvidia glauben? Das Unternehmen, das dieses skalierbare Lern-Puzzle löst, wird nicht nur einen besseren Roboter bauen; es wird höchstwahrscheinlich die Blaupause für das nächste Jahrzehnt der künstlichen Intelligenz und Automatisierung liefern.