DALL-E, mach mir bitte einen weiteren Picasso

Seit Menschen irgendwann in der Altsteinzeit die Kunst erfunden haben, haben sie viele Bilder produziert – „Die Sternennacht“, einige Memes, dieses Foto von Donald Trump, der auf die Sonnenfinsternis starrt. Was macht das alles aus? Vor einigen Jahren hat eine Firma namens OpenAI einen Großteil dieser Bilder zusammen mit Textbeschreibungen in das neuronale Netzwerk einer künstlichen Intelligenz namens DALL-E. DALL-E wurde darin geschult, eigene Originalkunst in jedem Stil zu schaffen, die auf der Grundlage schriftlicher Anweisungen fast alles Gewünschte in unheimlichen Details darstellt. Aber die Beherrschung des gesamten Universums menschlicher Bilder macht schwierige Entscheidungen. Wie entscheidest du was DALL-E erstellen soll? Nach sorgfältiger Überlegung war eines der ersten Bilder, die OpenAI dazu veranlasste, ein Donut aus Stachelschweinstacheln.

„Es gab diesen Glauben, dass Kreativität etwas zutiefst Besonderes, nur Menschliches ist“, erklärte Sam Altman, CEO von OpenAI, neulich. Vielleicht nicht mehr so ​​wahr, sagte er. Altman, der einen grauen Pullover trug und zerzaustes braunes Haar hatte, führte eine Videokonferenz vom Hauptsitz des Unternehmens in San Francisco aus. DALL-E befindet sich noch in einer Testphase. Bisher hat OpenAI einer ausgewählten Gruppe von Menschen – Forschern, Künstlern, Entwicklern – Zugang gewährt, die damit eine breite Palette von Bildern erstellt haben: fotorealistische Tiere, bizarre Mashups, witzige Collagen. Von einem Benutzer gebeten, „einen Teller mit verschiedenen außerirdischen Früchten von einem anderen Planeten, Foto“ zu erstellen. DALL-E gab so etwas wie Rambutans zurück. “Der Rest von Mona Lisa” ist laut DALL-E, meistens nur eine große Klippe. Altmann beschrieben DALL-E als „Erweiterung der eigenen Kreativität“.

Für die mehr als eine Million Menschen auf DALL-Eder Warteliste von , besteht die einzige Möglichkeit, ihre Kreativität zu erweitern, darin, mit einer Anfrage in die Instagram-DMs der KI zu schlüpfen. Das Unternehmen startete im April das Konto @openaidalle. „Ich war besorgt, dass es vielleicht mehr einer Erklärung bedarf, um die Leute zu engagieren“, sagte Natalie Summers, die das Konto für OpenAI betreibt, aus einem Konferenzraum in der Nähe von Altman. „Und das tat es nicht.“ @openaidalle hat mittlerweile fast zweihunderttausend Follower. Es ist Summers Aufgabe, die Nachrichten durchzulesen und die Besten der Besten auszuwählen. „Wenn ich alles tun würde, was die Leute verlangen, hätten wir viele Waschbären und Faultiere“, sagte sie. Zu den Hits gehörten „Cheeseburger-Lampe“, „emotionales Gepäck“ (Koffer mit traurigen Gesichtern) und „attraktiver Dinosaurier im Smoking, der sich selbst im Spiegel betrachtet und sein Spiegelbild sieht, digitale Kunst“, die DALL-E ausgestattet mit menschenproportionierten Armen, um seine Schärfe zu unterstützen. Die Bewertungen waren von der überwältigenden Vielfalt. „Ich werde meinen Job verlieren“, postete ein Kommentator, dessen Profil besagte, dass er Grafikdesigner sei, unter einem Bild von Fimo-Drachen, die auf einem Boot Pizza essen.

Um die neuesten Anfragen zu sichten, führte Summers, die baumelnde Ohrringe und eine Jeansjacke trug, eine Videokonferenz mit ihr durch DALL-EJoanne Jang, Produktmanagerin von , und Aditya Ramesh, einem Mitglied des technischen Personals. Ramesh war dafür verantwortlich DALL-Eder Name; es kam ihm in der Dusche. „Einige Leute haben es sofort verstanden“, sagte er. „Anderen Leuten musste ich erklären, dass es ein Portmanteau ist.“

Es gibt Regeln für Anfragende. Bilder von Persönlichkeiten des öffentlichen Lebens sind tabu, ebenso wie alles, was auch nur annähernd anstößig ist, einschließlich Nacktheit und Gewalt. Politischer Wahlkampf ist verboten. „Wir sind besorgt über Deepfakes“, sagte Summers. Kürzlich entwickelte ein Forscher namens Boris Dayma einen Low-Fi-Nachahmer namens DALL-E Mini, das viral ging. Benutzer durften Eingabeaufforderungen wie „Ice T in einem Glas Eistee“ und „Babies Faustkampf“ einreichen, obwohl die Ausgabe manchmal unheimlich ist: Ice-Ts Gesicht scheint zu schmelzen; Die Babys sehen aus wie Zombies. Auf Anfrage von OpenAI DALL-E Mini wurde in Craiyon umbenannt. („Es gab viel Verwirrung“, sagte ein OpenAI-Sprecher.)

Summers begann zu scrollen. „Hier ist eine, die ich heute Morgen gefunden habe: ‚eine Katze mit einem Bett aus Tulpen, die aus ihrem Rücken wachsen’“, sagte sie. Sie klickte auf eine Schaltfläche, und das System zeigte zehn Bilder an. Alle zeigten Tulpen, aber nur bei einer wuchsen Tulpen aus dem Rücken einer Katze – allerdings nicht genug, um sich als „Bett“ zu qualifizieren. Ramesh versuchte es mit der Eingabeaufforderung, und die Maschine spuckte eine weiße Katze aus, aus deren Fell etwa zwei Dutzend Tulpen sprossen. „Ich liebe es, wie pummelig die Katze ist“, sagte Jang. Summers schickte das Foto an den Benutzer, der mit drei Lächeln-Emojis antwortete.

Sie wandten sich an „einen Astronauten, der in einem Diner isst, das im Weltraum schwebt“. Jang entdeckte ein Problem mit DALL-E‘s Arbeit: zu viel Schwerkraft.

„Oh, das stimmt“, sagte Ramesh. “Ich werde sehen, ob ich schwimmendes Essen bekommen kann.” Ein paar Formulierungsänderungen führten zu einem Astronauten mit einem Stück Toast, der aus einem Diner-Fenster auf die Sterne starrte. “Es ist, als würde er über die Entscheidungen seines Lebens nachdenken”, sagte Ramesh. Sie gingen mit einer weniger melancholischen Option.

Als nächstes: ein Fischangeln. “Wie wäre es mit diesem?” sagte Ramesh und zog eine Illustration eines grünen Fisches hoch, der einen Fischerhut trägt, mit einem kleineren Fisch, der an einer Rute baumelt.

“Das ist gut, weil er alarmiert aussieht, in dieser Meta-Situation zu sein”, sagte Summers.

Das Treffen neigte sich dem Ende zu, aber sie beschlossen, noch ein paar Anfragen anzunehmen. Ein Benutzer hatte einfach nach „The Big Bang“ gefragt. Jang holte tief Luft. “Dafür gibt es eine Menge künstlerischer Freiheit”, sagte sie. ♦


source site

Leave a Reply