Ich habe die Zukunft der KI miterlebt, und sie ist ein kaputtes Spielzeug

Diese Geschichte sollte einen anderen Anfang haben. Sie sollten davon hören, wie ich Anfang dieser Woche an einer spritzigen Einführungsparty für ein neues KI-Gerät – den Rabbit R1 – in New York City teilnahm und dann, auf einem windigen Bordstein vor dem Veranstaltungsort stehend, einen Knopf am Gerät drückte Gerät, um ein Uber-Haus zu rufen. Stattdessen schlug die Verbindung fehl, nachdem wir es vielleicht eine Stunde lang eingerichtet und damit herumgefummelt hatten.

Das R1 ist ein leuchtend orangefarbenes Gerät mit einer Kamera, einem Mikrofon und einem kleinen Bildschirm. Halten Sie die einzelne Taste gedrückt, stellen Sie ihm eine Frage oder geben Sie ihm mit Ihrer Stimme einen Befehl, und das niedliche, hüpfende Kaninchen auf dem Bildschirm spitzt die Ohren und spricht dann mit Ihnen. Theoretisch ist es so, als würde man mit ChatGPT über ein Walkie-Talkie kommunizieren. Sie könnten es bitten, eine bestimmte Blume mithilfe seiner Kamera zu identifizieren oder ein Lied abzuspielen, das auf halb erinnerten Texten basiert. Sie könnten nach einem Uber fragen, aber es könnte auf der letzten Stufe hängen bleiben und Sie in Queens festsitzen lassen.

Als ich endlich in mein Hotelzimmer zurückkam, schaltete ich die Kamera des R1 ein und hielt ein kaltes Stück Pizza hoch. “Was Schau ich mir da an?” Ich fragte. „Du siehst ein Stück Pizza an“, sagte mir die Stimme. (Richtig!) „Es sieht appetitlich und frisch gebacken aus.“ (Naja, nein.) Ich beschloss, etwas anderes auszuprobieren. „Was sind die Top 10 …“ Ich stolperte und ließ den Knopf los. Ich habe es noch einmal versucht: „Was sind die 10 besten Anwendungsfälle für KI für einen normalen Menschen?“ Das Gerät, vielleicht durch unsere vorherige Interaktion verwirrt, begann, Pizzabeläge aufzulisten, beginnend mit der Nr. 2. „2. Wurst. 3. Pilze. 4. Extra Käse.“

Bisher wurde Verbraucher-KI größtenteils durch Software definiert: Chatbots wie ChatGPT oder die aufgemotzte Autokorrektur des iPhones. Jetzt erleben wir eine Dingifizierung: Unternehmen bringen echte Metall- und Kunststoffteile auf den Markt und produzieren sie, die ausschließlich auf KI-Funktionen ausgerichtet sind. Diese Geräte unterscheiden sich von früheren KI-Gadgets wie dem Amazon Echo dadurch, dass sie die fortschrittlichere generative KI-Technologie integrieren, die in letzter Zeit in Mode gekommen ist und den Benutzern natürlichere Interaktionen ermöglicht. Es gibt Pins und Anhänger und eine ganz neue Runde an Datenbrillen.

Doch trotz all ihrer Versprechen verläuft diese neue Ära nicht sehr gut. Nehmen Sie Humane, einen Rabbit-Konkurrenten, der Anfang des Monats einen tragbaren „AI Pin“ auf den Markt gebracht hat. Dieses Gerät wurde als Smartphone-Ersatz positioniert, zu einem entsprechenden Preis: Es kostet 699 US-Dollar und erfordert eine monatliche Abonnementgebühr von 24 US-Dollar. Rezensenten kritisierten den Pin brutal und sagten, er sei langsam, überhitze und habe Schwierigkeiten, grundlegende Fragen zu beantworten. „Es fällt mir schwer, eine einzige Sache zu nennen, in der es wirklich gut ist“ Der Rand schrieb.

Im Vergleich dazu ist der R1 in seinen Ambitionen zufriedenstellend klein und im Preis (relativ) erschwinglich (199 US-Dollar, kein Abonnement). Das Gerät selbst macht Spaß und ist retro-schick: Jesse Lyu, Gründer und CEO von Rabbit, soll Berichten zufolge jedem Mitglied seines Teams ein Tamagotchi als Inspiration gekauft haben. Und fairerweise muss man sagen, dass der R1 einige interessante Dinge macht. Auf der Bühne zeigte Lyu, wie das Gerät eine handgeschriebene Tabelle interpretieren und in eine funktionierende digitale Tabellenkalkulation umwandeln kann. Auf meine Anfrage gelang es ihm, eine Zusammenfassung einer handgeschriebenen Seite vorzulesen, allerdings nur mit einer Genauigkeit von etwa 65 Prozent. Ich konnte das Gadget nutzen, um eine Acai-Schüssel auf DoorDash zu bestellen, allerdings konnte es keine individuellen Anpassungen vornehmen. (Ich wollte Erdnussbutter.) Und ich habe Uber nie zur Arbeit gebracht. (Allerdings teilte mir das Gerät irgendwann mit, dass die Anfrage fehlgeschlagen sei, obwohl dies nicht der Fall war, und ließ mich auf eine 9-Dollar-Fahrt warten, die ich gar nicht erst in Anspruch genommen hatte.)

Eines der großen Verkaufsargumente des R1 ist, dass er angeblich mit einem sogenannten Large ausgestattet ist Aktion Modell oder LAM – eine Variante des Ausdrucks großes Sprachmodell, die Technologie, die aktuelle Chatbots antreibt. Während ChatGPT Fragen beantworten und Ihnen einen mittelmäßigen Aufsatz verfassen kann, kann R1 theoretisch Aktionen ausführen, die Sie möglicherweise in anderen Apps ausführen (z. B. Ihrem Freund einen Venmo für 20 $ senden). Rabbit hat gesagt, dass das Gerät jede App erlernen kann, wenn man es ihr beibringt. Lyu verglich die Technologie mit einem Tesla: Im Autopilotmodus kann ein Tesla-Auto theoretisch ein Stoppschild erkennen, nicht weil Ingenieure ihm sagen, wie ein Stoppschild aussieht, sondern weil es anhand unzähliger Stunden Filmmaterial darauf trainiert wurde, die physischen Eigenschaften des Schilds zu erkennen. Ebenso kann R1 Aufgaben auf Ihrem Telefon ausführen, ohne dass jede App erlernt werden muss.

Das Problem ist, dass nichts davon wirklich real ist. Zumindest jetzt noch nicht. Wie bei so vielen KI-Produkten ist auch beim R1 eher ein Hype als ein überzeugender Anwendungsfall der Antrieb. (Schließlich könnten so viele seiner Funktionen auf einem Smartphone ausgeführt werden.) Bereits im Februar sagte Lyu, dass der Rabbit sein Modell mit 800 Apps trainiere. Diese Woche wurde es mit der Möglichkeit eingeführt, nur vier zu verwenden: Spotify, DoorDash, Uber und Midjourney (ein beliebter KI-Kunstgenerator). Das Unternehmen sagt, LAM befinde sich in einem „sehr frühen Stadium“.

Auf der Bühne vor einem Publikum aus Reportern und Rabbit-Fans wirkte Lyu am Dienstagabend zeitweise nervös, einmal ermutigte er die Leute zum Lachen, um seine Nervosität zu beruhigen. Vor der Veranstaltung hatte ein Benutzer auf GitHub gepostet, in dem er Rabbit beschuldigte, seine Technologie falsch dargestellt zu haben. „Für diejenigen mit technischem Hintergrund ist es schmerzlich klar, dass keine künstliche Intelligenz oder ein großes Aktionsmodell in Sicht ist“, heißt es in dem anonymen Beitrag, der inzwischen gelöscht wurde. Auf X, Lyu bezeichnete den Beitrag als „alles falsche Behauptungen“. Lyu versprach, alle Fehler zu beheben, die in R1-Geräten auftreten könnten. Bevor er DoorDash auf der Bühne vorführte, gab er zu, dass die Funktion noch nicht so schnell funktioniert, wie sie es gerne hätten: „Aber ich möchte es euch zeigen, und ich möchte ehrlich zu euch sein.“

Doch Lyu kündigte auch atemlos eine Reihe neuer Initiativen an, darunter ein konzeptionelles System, das es den Menschen eines Tages ermöglichen würde, das Physische und das Digitale zu verschmelzen, sodass die Menschen auf verschiedene intelligente Gegenstände in ihrem Zuhause zeigen und sie über die KI von Rabbit steuern könnten. (Es ist egal, dass der R1 ohne viele seiner versprochenen Funktionen auf den Markt kam.) Gegen Ende der Präsentation die Worte Demütig sein erschien auf der riesigen Leinwand hinter ihm. „Wir sind ein wirklich, wirklich bescheidenes Team“, sagte Lyu der Menge. Diese Worte waren immer noch zu hören, als sich wenige Augenblicke später die Vorhänge auf beiden Seiten der Bühne dramatisch senkten und den Blick auf Förderbänder voller Kisten mit R1 freigaben. Die Musik begann zu dröhnen und die Leute standen Schlange, um sich ihre zu schnappen.

Der R1 ist eine Erinnerung an die Kluft zwischen einer Kultur im Silicon Valley, in der Geschwindigkeit oft Vorrang vor Qualität hat, und den hohen Erwartungen der Verbraucher an die von ihnen verwendeten Produkte – im Guten wie im Schlechten. Und um fair zu sein: Die Erwartungen sind hoch, zumindest teilweise aufgrund der außergewöhnlichen Produkte, die im Laufe der Jahre aus derselben wettbewerbsorientierten und iterativen Kultur hervorgegangen sind.

Als die Party zu Ende ging, traf die Nachricht vom ersten Fehler ein: Es gab keine Möglichkeit, die Zeitzone auf den Geräten zu ändern, von denen viele standardmäßig auf die Westküste programmiert waren. Es stellt sich heraus, dass die Zukunft drei Stunden zurückliegt.


source site

Leave a Reply