Aus dem Internet-Observatorium #127
KI-gesteuerte Robotik: Humanoide in Bewegung / Trump vs. EU-Regulierung: Es spitzt sich zu
Hallo zu einer neuen Ausgabe! Die Bundestagswahl ist vorbei, hoffentlich erscheint dieser Newsletter künftig wieder etwas näher am eigentlichen Mittwochstermin (man wird ja noch Träume haben!).
P.S. Die Re:publica hat erfreulicherweise meine Session “Manufacturing consent with AI companions” akzeptiert. Vielleicht sehen wir uns ja dort!
KI-gesteuerte Robotik: Humanoide in Bewegung
Es gibt Themen, die liegen in der Luft. Spätestens als auf der CES Nvidia-Chef Jensen Huang vom “ChatGPT-Moment für Robotik” sprach, ist es das Thema “KI-gesteuerte Robotik”. In den vergangenen Wochen hat sich der Eindruck bei mir verfestigt, dass Huang recht haben könnte. Und selbst beim Schreiben dieses Textes scheint sich der Eindruck des Hypes zu bestätigen, erschien doch gestern gerade eine Kolumne von Christopher Mims im Wall Street Journal. Darin skizziert er, was sich gerade verändert (übersetzt und gefettet):
“Science-Fiction ist schon lange voll von Robotern, die so aussehen, sich bewegen und sogar denken wie wir. In der realenWelt waren humanoide Formen bis vor kurzem ein Ding der Unmöglichkeit. Sie sind schwer zu bauen, teuer, langsam undschwerfällig und haben im Vergleich zu den unzähligen anderen Varianten von speziell angefertigten – und weitaus günstigeren – Robotern, die sich in den letzten zehn Jahren rasant vermehrt haben, nie einen Sinn ergeben.
Das ändert sich gerade. Da die weltweite Nachfrage nach neuen Robotertypen in die Höhe geschossen ist, machen die Massenfertigung und sinkende Kosten für Komponenten deren Herstellung billiger. Genauso wichtig ist, dass neue Arten von KI – die eng mit der Art verwandt sind, die seit dem Debüt von ChatGPT die Prioritäten vonTechnologieunternehmen und Regierungen auf den Kopf gestellt hat – Roboterkörper auf eine Weise animieren, die noch vor ein paar Jahren einfach nicht möglich war.”
Mims spielt damit auf multimodale KI-Systeme an, die visuelle Wahrnehmung, Sprachverarbeitung und motorische Steuerung kombinieren. Damit sollen Roboter in Echtzeit anweisungsbasiert und autonom handeln können.
Mims erinnert allerdings auch daran, dass wir weiterhin vor allem von Prototypen reden. Und ich würde noch ergänzen: “Humanoide Roboter” sind nicht die einzige Erscheinungsform, die von den Transformer-Modellen in der KI profitiert: Das Feld der “kognitiven Robotik”, also von Robotern mit verbesserter Wahrnehmung und autonomen Verhalten, aber nicht-menschlicher Anlehnung, ist besonders für Industrie und Logistik interessant.
Ein paar Meldungen aus den vergangenen Wochen zeigen, dass die Kombination von KI und Robotik in den Fokus von Small und Big Tech rückt:
Meta kündigte vor gut zwei Wochen an, seine Hardware-Abteilung (Reality Labs) um eine Sparte für humanoide Roboter zu erweitern. Der Schwerpunkt liegt dabei darauf, eine Art KI-basiertes Android für Robotik zu entwickeln.
Bei Apple arbeiten sowohl Hardware-, als auch KI-Forschungsteams an Robotik-Ideen. Laut Mark Gurman von Bloomberg entwickelt Apple ein Tischgerät mit einem Roboterarm und einem Display das als hochwertige Version eines Smart-Home-Hubs fungieren soll. Außerdem forscht man an mobilen Robotern.
Ende Januar erklärte Elon Musk, mehr Geld für das Training seines Tesla-Allzweckroboters Optimus ausgeben zu wollen. Allerdings wird der Optimus (anvisierter Verkaufspreis zwischen 20.000 und 30.000 US-Dollar) auch 2025 nicht auf den Markt kommen. Eigentlich sollte er schon seit 2022 verfügbar sein.
Auch Nvidia beschäftigt sich mit dem Thema, auf der Entwicklerkonferenz GTC wird ein
Die chinesische Firma Unitree Robotics aus Hangzhou, deren Roboter “G1” im Januar mit einem Tanz-Auftritt viral ging, hat Trainings-Algorithmen und Hardware-Designs des Modells Open Source bei Github veröffentlicht - ein Schritt, der Erinnerungen an DeepSeek wachruft. (Die Videos auf dem YouTube-Kanal der Firma sind auch beeindruckend, aber keine Ahnung, wie echt die sind)
Das Startup Figure AI, das unter anderem Funding von Microsoft, OpenAI, Nvidia und Jeff Bezos erhielt, veröffentlichte Helix, ein generalistisches Vision-Language-Action (VLA)-Modell zur besseren Umgebungserkennung und Reaktion von Robotern. Zudem verhandelt man Bloomberg zufolge gerade über eine Finanzierungsrunde in Höhe von 1,5 Milliarden US-Dollar. Die Bewertung der Firma würde dann in Richtung 40 Milliarden US-Dollar gehen.
Der deutsche Anbieter Neura Robotics für kognitive Robotik konnte im Januar eine Series B mit einem Volumen von immerhin 120 Millionen Euro einsammeln (hier ein Firmenporträt in der FAZ, €)
Wenn ich diesen Artikel bei LessWrong richtig verstehe, spielen die architektonischen Veränderungen bei großen Sprachmodellen (LLMs) auch in der Robotik eine zunehmende Rolle:
Der Fokus verschiebt sich ebenfalls von “mehr Daten” zu “intelligenterem Design”. Architektur schlägt Skalierung. Gut für Energieverbrauch und Trainingsbedarf!
Diffusion-Modelle, die bei der Bildgenerierung verwendet werden, werden auf die Robotersteuerung angewendet (“physical Intelligence”).
Edge Computing und Fortschritte wie Embedded GPUs (energieeffizientere Grafikprozessoren) ermöglichen lokale Datenverarbeitung, was wiederum für eine bessere Latenz und höhere Sicherheit sorgt.
Ich weiß noch nicht, was ich aus diesen Entwicklungen schlussfolgern soll. Dem Eindruck nach werden Roboter immer filigraner und können immer besser aus der Kombination von Wissen & Umgebungswahrnehmung lernen. Sie werden also nicht nur der Form nach “humanoider”. Sollte diese Entwicklung halbwegs linear verlaufen, würden wir in den nächsten zwei bis vier Jahren tatsächlich eine ernsthafte politische Diskussion über die Folgen der Automatisierung komplexer manueller Tätigkeiten führen.
Aber: Wir reden im Moment weitestgehend von Prototypen. Und weiterhin hat die physische Welt (und die Interaktion mit ihr) einige Komplexitäten zu bieten. Die “Sturheit der Dinge” eben (siehe Ausgabe #85). Und dass die üblichen Hype-Maschinisten auf Substack und selbst die Crypto-Leute plötzlich auf das Thema Robotik abfahren (dezentrale Roboter auf der Blockchain ftw!), macht mich eher skeptisch.
Allerdings gibt es dann auch noch diese Theorie, mit der ich mich in Ausgabe #58 einmal beschäftigt habe: Nämlich dass echte (Künstliche) Intelligenz aus Silicon-Verschaltungen einen Körper braucht (“embodied cognition”), um wirklich “intelligent” zu sein. Was wiederum die dann doch sehr science-fiction-artige Frage aufwirft: Was genau bauen wir Menschen da eigentlich gerade?
Trump vs. EU-Regulierung: Es spitzt sich zu
Vergangenen Freitag veröffentlichte das Weiße Haus ein Memorandum, das den Konflikt zwischen amerikanischen Tech-Firmen und der EU-Kommission noch einmal verschärfen dürfte: Der US-Handelsbeauftragte soll demnach prüfen, ob amerikanische Firmen durch ausländische Gesetze unfair behandelt würden.
Im Digitalbereich geht es dabei um im Ausland erhobene Digitalsteuern, aber auch um Regulierungen, die “diktieren, wie amerikanische Firmen mit Verbrauchern in der Europäischen Union interagieren” und Strafzahlungen zur Folge haben können. Im Memorandum ist in diesem Zusammenhang von “Erpressung” die Rede. Konkret werden Digital Markets Act (DMA) und Digital Services Act (DSA) genannt. Auch die Datenschutzgrundverordnung (DSGVO) dürfte betroffen sein, leitet heise.de logisch davon ab.
Trump hatte bekanntermaßen Strafen gegen US-Unternehmen in Davos als “eine Form von Besteuerung” kritisiert. Als mögliche “Gegenmaßnahmen” werden in der Presseerklärung zum Memorandum Zölle gegen die EU genannt.
Gerade der wettbewerbsrechtlich angelegte DMA rückt im Moment in den Mittelpunkt: Offenbar steht die EU-Kommission kurz davor, das Verfahren gegen Alphabet/Google wegen Selbstbevorzugung mit einer Geldstrafe abzuschließen.
Aus den USA kommt (unter anderem deshalb?) auch von den Republikanern im Kongress Druck: Am Sonntag verschickte XL-Trumpist Jim Jordan, Vorsitzender des Justizausschusses im Repräsentantenhaus, einen Brief an die EU-Wettbewerbskommissarin Teresa Ribera. Darin forderte er Aufklärung, wie die EU den DMA durchsetzt und wiederholte Trumps Kritikpunkte. Und die Financial Times berichtet, dass auch die amerikanischen Tech-Firmen in Brüssel gerade für Veränderungen am DMA lobbyieren.
Der DMA hat seine High- und Lowlights, ist aber für mich der überzeugendste Teil der jüngsten EU-Digitalregulierung. Im Umgang mit Alphabet, aber auch mit Apple, Meta und Amazon - ging es von vorneherein nicht nur um die Fragen technischer Umsetzung von Wettbewerbsvorgaben (siehe Ausgabe #88); sondern auch darum, ob man Plattform-Märkte mit Regulierung einhegen kann und welche Signale man damit sendet. Die Entscheidung über Verstöße war im Kern immer auch eine politische, wenn auch eine, die gerichtsfest sein muss. Das gilt weiterhin, nur dass die EU-Kommission nun plötzlich auf das große Ganze des transatlantischen Verhältnisses inklusive Handelskonflikt blicken muss. Trotz aller Zusicherungen, dass man die Regeln durchzieht: Es dürfte eine interessante Zeit sein für die zuständigen Abteilungen DG Comp und DG Connect.
Das alles ist aber nur dre Auftakt. Ein weiteres Gesetz, das bald in den Mittelpunkt rücken könnte, ist der AI Act. Meta-Chefdiplomat Joel Kaplan bereits angekündigt, den für April in finaler Form angekündigten “Code of Practice” für große (Grundlagen-)Sprachmodelle nicht unterschreiben zu wollen. Und auch im Kontext DSA läuft es angesichts der sehr laxen Compliance von X sowie den laufenden Untersuchungen auf eine baldige Konfrontation heraus.
NPC und Strategien der Entmenschlichung
Ezra Klein sagte jüngst in seinem Podcast zur rhetorischen Strategie, die Musk und die neu Online-Rechte verfolgen, unter anderem, um die DOGE-Aktivitäten zu rechtfertigen (übersetzt):
“Vor ein paar Jahren wurde die Online-Rechte von einem neuen Epitheton für Liberale angezogen: „NPC“, kurz für ‚Non Playable Character‘. Der Begriff wurde aus Videospielen übernommen, wo sich “NPC” auf die computergesteuerten Charaktere bezieht, die das Spiel bevölkern, während Sie, der lebende Spieler, die Entscheidungen treffen. NPCs haben keinen eigenen Verstand. Sie sind Automaten. Sie tun, was man ihnen sagt.
“NPC” wurde schnell zu einer beliebten Bezeichnung für all die Liberals mit ihren Black Lives Matter- und #MeToo-Hashtags, ihren ukrainischen Flaggensymbolen, ihren ‘sie/ihr’-Pronomen und Antirassismus-Lesegruppen. Liberals, so lautete die Erzählung, dachten, was ihnen [im allgemeinen Konsens] zu denken erlaubt war, und sagten, was ihnen zu sagen erlaubt war. Vielleicht haben Sie die Memes gesehen - gesichtslose graue Gesichter, manchmal umgeben von liberalen Symbolen. Elon Musk hat sie gerne gepostet.”
Ich bin gerade nicht nahe genug an der Neuen Online-Rechten dran um zu bewerten, wie verbreitet dieser Tropus unter Trump II ist. Aber Klein liegt falsch, wenn er “NPC” als manipulierbare Automaten beschreibt. “NPC” sind Figuren, auf die man keine Rücksicht nehmen muss, weil sie kein Teil der aktiven Oberfläche sind.
Ich schreibe auf meinem Blog seit 2016 immer wieder über die beginnende Entmenschlichung, die wir erleben. “NPC” ist Entmenschlichung, die durch den Games-Kontext harmlos anmutet, aber im Kern einen Dualismus eröffnet: zwischen Menschen von Wert und Menschen, die keinen Wert haben. Die Barbararei, die daraus oft folgt, ist in dieser Logik bereits angelegt.
Und das Perfide an dieser Strategie ist, dass sie anders als Alice Weidels menschenverachtendes Gerede von “Kopftuchmädchen” und “Messermännern” abstreitbar ist (“plausible deniability”). Wer meine obigen Absätze liest, kann entgegnen: “Haha, völlig paranoid, wir reden hier über Memes und Videospiel-Sprech und du befürchtest das nächste Ruanda 1994”.
Während sich also an Logik orientierte Menschen also schnell in unauflösbare Sprachspiele und Bedeutungsdebatten verwickeln lassen, vollzieht sich für die Eingeweihten ein memetisches Worldbuilding, das völlig ohne eine konkrete Verständnisebene auskommt.
Notizen
Y Combinator Supports AI Startup Dehumanizing Factory Workers
Links
BMI zur Bundestagswahl 2025: Beeinflussungsversuche, aber keine Wahlmanipulation.
Nach der Bundestagswahl: Welche Digitalpolitiker gehen (müssen) und wer nachkommt.
Fünf Learnings aus der Bundestagswahl. (€)
Anthropic veröffentlicht Claude 3.7 Sonnet. ($)
DOGE will automatisiert Staatsbedienstete feuern.
Das EFI-Gutachten 2025 ist da.
Auch TikTok dünnt Trust & Safety aus.
Apple, Trump, 500 Milliarden und die Kunst, alte Pläne neu zu verpacken.
Endlich (aus Security-Sicht): Gmail beendet 2FA über SMS.
Landesdatenschutzbeauftragte vs. DeepSeek.
KI-Policy-Änderung der EU: Anpassung oder Kapitulation?
Handelsbeschränkungen mit China: US-Chipbranche schlägt Alarm.
Über die PEW-Studie zu KI am Arbeitsplatz.
Warum die US-Regierung weiterhin COBOL nutzt.
Evolution statt Revolution: Wie KI Entwickler-Jobs verändert. Plus: Enter “Vibecoding”
Künstliche Intelligenz, Startups und der Erfolg von “tiny teams”. ($)
Künstliche Intelligenz hat das Web gegessen. Und kommt jetzt für einen Nachschlag. ($)
Warum wurde diese KI zum Nazi?
Der Bedarf nach Rechenzentren geht nicht zurück, er ändert sich wieder.
Der Rechtsruck der Tech-Oligarchen, historisch. (€)
China möchte, dass Tech-Firmen Daten besser monetarisieren.
Der Stand in Sachen Audiobooks.
Journalisten, die KI-Modelle trainieren.
Stellenausschreibung für ein Digitalministerium.
Digitale Souveränität: Eine Bedienungsanleitung.
Bis zur nächsten Ausgabe!
Johannes