Der iPhone-Moment der generativen KI – The Atlantic

Nach fast sieben Monaten voller Gerüchte und Verzögerungen hat Google endlich sein bisher fortschrittlichstes generatives KI-Modell veröffentlicht: Gemini 1.0, ein Programm, das das Unternehmen als eine der leistungsfähigsten Software aller Zeiten bewirbt. Es kann angeblich Rechenaufgaben lösen, Memes erklären, Code schreiben und – in einem realen Beispiel des Unternehmens – Feedback zu Kochfotos geben, um Ihnen bei der Entscheidung zu helfen, wann Ihr Omelett fertig ist. Google bezeichnet Gemini sogar als „einen ersten Schritt in Richtung eines wirklich universellen KI-Modells“, eines Modells, das von Grund auf darauf ausgelegt ist, mit Bildern, Videos, Text, Audio und Computercode in verschiedenen Kontexten zu interagieren. Und irgendwie fühlt sich alles ein wenig enttäuschend an.

Vielleicht liegt das daran, dass sich die heutige Ankündigung wie jede andere Produkteinführung im Silicon Valley anfühlt. Gemini gibt es in drei verschiedenen Versionen – Nano, Pro und Ultra – die für Aufgaben mit zunehmender Komplexität geeignet sind, ähnlich einem iPhone 15 Plus, Pro und Pro Max. (Nano und Pro sind jetzt verfügbar, Ultra wird jedoch erst Anfang nächsten Jahres auf den Markt kommen; im Moment handelt es sich um eine Branding-Übung.) Am höchsten Ende kann Gemini das Topmodell von OpenAI, GPT-4, bei den meisten Kennzahlen übertreffen. Aber das sind iterative Fortschritte – weniger wie die Erfindung eines Smartphones, sondern eher wie das Hinzufügen einiger Megapixel zu seiner Kamera. Der Start von Gemini ist das bisher deutlichste Zeichen dafür, dass die generative KI ihre Unternehmensphase erreicht hat.

Die Veröffentlichung von Gemini erfolgt genau einen Monat, nachdem OpenAI seine erste Entwicklerkonferenz veranstaltet hat – ein Tag, der der Vorstellung neuer GPT-basierter Produkte und der Ankurbelung der damit verbundenen Einnahmequellen gewidmet war und der der jährlichen Worldwide Developers Conference von Apple oder der ähnlichen I/O von Google sehr ähnlich sah. O Ereignis. Der DevDay von OpenAI trug dazu bei, einen epischen Konflikt am Hauptsitz des Start-ups in San Francisco auszulösen, bei dem der CEO Sam Altman gestürzt wurde, zumindest teilweise, weil er die Technologie des Unternehmens zu schnell kommerzialisierte. Fünf Tage später wurde er mit der Unterstützung der mächtigsten Investoren von OpenAI wieder eingestellt. Der größte dieser Unterstützer, Microsoft, hat nun einen nicht stimmberechtigten Sitz im gemeinnützigen Vorstand von OpenAI und fügt damit das zweitgrößte Unternehmen der Welt zu einem Unternehmen hinzu, das ursprünglich darauf ausgerichtet war, die Gier der Unternehmen zu bekämpfen.

Google, OpenAI und Microsoft sind nicht die einzigen im Wettlauf um generative KI in Unternehmen. Bei einer Telefonkonferenz Anfang des Jahres sagte Mark Zuckerberg, CEO von Meta, ausdrücklich, dass die Verbesserung der KI zu ansprechenderen Produkten und damit zu mehr Werbegeldern führt, und dass dies auch bei sogenannten Basismodellen wie Gemini oder Metas eigenem Llama der Fall sei Schaffung „völlig neuer Produktklassen“. Ende letzten Monats veröffentlichte Amazon seinen eigenen KI-gestützten Assistenten Amazon Q, der Unternehmen helfen soll, und ein aktueller Amazon-Ergebnisbericht kündigte eine „Reihe generativer KI-Veröffentlichungen“ an, die die Gewinne des Unternehmens steigern würden. Der KI-Boom machte den Chiphersteller Nvidia zu einem Billionen-Dollar-Unternehmen. Sogar Apple, das spät dran ist, gibt Berichten zufolge täglich Millionen von Dollar für die Entwicklung seiner fortschrittlichsten KI-Modelle aus und beginnt mit der Veröffentlichung von Software-Frameworks, die es Entwicklern ermöglichen würden, generative KI in Apps zu integrieren. Momentan geht es bei der generativen KI eher um Wettbewerb als um Revolution.

Da Big Tech um denselben Goldschatz wetteifert, wird es immer schwieriger, KI-Produkte zu unterscheiden. In einer Notiz zur Veröffentlichung von Gemini sagte Sundar Pichai, CEO von Google, dass generative KI Wissen und Produktivität auf eine Weise beschleunigen werde, „die wir noch nie zuvor gesehen haben“. Aber wir hören seit Jahren immer wieder Behauptungen, dass das neueste Smartphone, VR-Headset oder die neueste Bürosoftware dasselbe tun werden. Googles Chatbot Bard, der ab heute das Gemini Pro-Modell verwendet, hat im vergangenen Jahr drei zugrunde liegende generative KI-Programme durchlaufen; Auch ChatGPT von OpenAI hat im vergangenen Jahr einige Software-Updates erhalten. Bard und ChatGPT lernten, Bilder zu beschreiben; die Häufigkeit, mit der sie irreführten und halluzinierten, nahm ab; ihre Prosa wurde straffer und direkter. Aber die grundsätzliche Erfahrung, nützliche Antworten aus einem quasi-intelligenten Bildschirm herauszukitzeln, hat sich nicht geändert, genauso wie das Fahren eines Autos mit besserer Kilometerleistung nicht wirklich neu, sondern eher einen Tick besser ist.

Diese KI-Modelle haben auch damit begonnen, Tore zu ganzen Ökosystemen anderer Produkte bereitzustellen, nicht unähnlich der Art und Weise, wie das iPhone über Funktionen verfügt, die sich mit denen des MacBook überschneiden. Bard kann Ihnen in Gmail, Google Drive und auf YouTube helfen, und GPT-gestützte KI-Assistenten sind in Microsofts eigener Suite von Cloud-Diensten verstreut. Nano ist ausdrücklich für den Betrieb auf Smartphones konzipiert und Google integriert es in sein Pixel 8 Pro-Gerät. Die gesamte Gemini-Suite ist außerdem für die Ausführung auf maßgeschneiderten Computerchips optimiert, die Google als die beste Möglichkeit zum Training von KI anpreist. Einen ähnlichen Ansatz verfolgt Microsoft bei seinen eigenen Modellen und Chips; Jeder Schritt der KI-Pipeline beinhaltet ein Big-Tech-Produkt, sei es für Menschen, die KI-Software verwenden, oder für Entwickler, die diese Programme auf den Datenservern von Big Tech programmieren. Die Technologiegiganten können viel von der Produktion generativer KI und ihrer Spin-off-Software profitieren: Sie ist eine von vielen Komponenten, die dazu beitragen, Verbraucher in das digitale Universum eines Unternehmens einzubinden.

Das Gewinnstreben, das heute offensichtlicher denn je ist, könnte eine noch größere Geheimhaltung dieser Technologieunternehmen rechtfertigen. Apple kämpfte jahrelang gegen Gesetze, die Einzelpersonen dabei helfen würden, ihre Geräte zu öffnen und zu reparieren, teilweise mit der Begründung, dass dadurch wertvolle Geschäftsgeheimnisse preisgegeben würden. In die gleiche Richtung könnte es gerechtfertigt sein, die KI – ohnehin schon eine undurchsichtige Technologie – streng unter Kontrolle zu halten.

Angeblich erhielt Gemini umfassende Bewertungen für „Faktizität, Kindersicherheit, schädliche Inhalte, Cybersicherheit, Biorisiko, Repräsentation und Inklusivität“. Dennoch weiß die Öffentlichkeit sehr wenig über diese Kontrollen, ähnlich wie die schädlichen Moderations- und Arbeitspraktiken früherer Software- und Gadget-Giganten unter Verschluss gehalten wurden. (Google antwortete nicht sofort auf eine Anfrage nach einem Kommentar zu den Sicherheitsbewertungen von Gemini.) Diese Undurchdringlichkeit macht es schwierig, Behauptungen über die Fähigkeiten von KI zu überprüfen, geschweige denn den Bau von Modellen zu verhindern, die beispielsweise ausgebeutete Arbeitskräfte oder Raubkopien verwenden. Man kann also davon ausgehen, dass der Wettlauf um generative KI unabhängig davon, ob er einen echten gesellschaftlichen Wandel auslöst oder lediglich ein neues Profitmodell bietet, diejenigen Technologieunternehmen gewinnen werden, die das jahrzehntealte Spielbuch des Silicon Valley am besten umsetzen.

source site

Leave a Reply