KI-Künstler stellen sich vor, was sich außerhalb des Rahmens berühmter Gemälde befindet, darunter das Mädchen mit dem Perlenohrring

Ein KI-Künstler kann nun einen Eindruck davon vermitteln, wie die Hintergrundkulissen berühmter Gemälde und Fotos ausgesehen haben könnten.

OpenAI, ein in San Francisco ansässiges Unternehmen, hat ein neues Tool namens „Outpainting“ für sein Text-zu-Bild-KI-System DALL-E entwickelt.

Outpainting ermöglicht es dem System, sich vorzustellen, was sich außerhalb des Rahmens berühmter Gemälde wie „Das Mädchen mit dem Perlenohrring“, „Mona Lisa“ und „Hunde spielen Poker“ befindet.

Wie Benutzer gezeigt haben, kann es dies mit jeder Art von Bild tun, wie dem Mann auf dem Quaker Oats-Logo und dem Cover des Beatles-Albums „Abbey Road“.

DALL-E setzt auf künstliche neuronale Netze (KNNs), die Simulieren Sie die Funktionsweise des Gehirns, um zu lernen und ein Bild aus Text zu erstellen.

GEÄNDERT: OpenAI, ein in San Francisco ansässiges Unternehmen, hat ein neues Tool namens „Outpainting“ für sein Text-zu-Bild-KI-System DALL-E entwickelt. Outpainting ermöglicht es dem System, sich vorzustellen, was sich außerhalb des Rahmens berühmter Gemälde wie „Das Mädchen mit dem Perlenohrring“ befindet

ORIGINAL: Mädchen mit Perlenohrring ist ein Ölgemälde auf Leinwand (um 1665) des niederländischen Künstlers Johannes Vermeer.  Abgebildet ist das Originalgemälde ohne KI-Manipulation

ORIGINAL: Mädchen mit Perlenohrring ist ein Ölgemälde auf Leinwand (um 1665) des niederländischen Künstlers Johannes Vermeer. Abgebildet ist das Originalgemälde ohne KI-Manipulation

WIE FUNKTIONIERT ES?

OpenAI hat ein neues Tool namens „Outpainting“ für sein Text-zu-Bild-KI-System namens DALL-E 2 entwickelt.

DALL-E 2 und sein Vorgänger DALL-E setzen auf künstliche neuronale Netze (KNNs), die Simulieren Sie die Funktionsweise des Gehirns, um zu lernen.

ANNs können darauf trainiert werden, Muster in Informationen wie Sprache, Textdaten oder visuellen Bildern zu erkennen.

OpenAI-Entwickler sammelten Daten auf Millionen von Fotos, damit der DALL-E-Algorithmus „lernen“ konnte, wie verschiedene Objekte aussehen sollten, und sie schließlich zusammensetzte.

Wenn ein Benutzer Text für DALL-E eingibt, um daraus ein Bild zu generieren, notiert es eine Reihe von Schlüsselmerkmalen, die vorhanden sein könnten

Ein zweites neuronales Netzwerk, das als Diffusionsmodell bezeichnet wird, erstellt dann das Bild und generiert die Pixel, die zur Visualisierung und Replikation erforderlich sind.

Beim Outpainting müssen die Benutzer die neuen erweiterten Visuals DALL-E in Textform beschreiben, bevor sie „gemalt“ werden können.

Outpainting, das sich in erster Linie an Profis richtet, die mit Bildern arbeiten, wird es den Benutzern ermöglichen, „ihre Kreativität zu erweitern“ und „eine größere Geschichte zu erzählen“, so OpenAI.

Das Unternehmen sagte in einem Blogbeitrag: „Heute stellen wir Outpainting vor, eine neue Funktion, die Benutzern hilft, ihre Kreativität zu erweitern, indem sie ein Bild über seine ursprünglichen Grenzen hinaus fortsetzen – visuelle Elemente im gleichen Stil hinzufügen oder eine Geschichte in neue Richtungen lenken – einfach durch Verwendung einer Beschreibung in natürlicher Sprache.

„Mit Outpainting können Benutzer das Originalbild erweitern und großformatige Bilder in jedem Seitenverhältnis erstellen.

„Beim Übermalen werden die vorhandenen visuellen Elemente des Bildes – einschließlich Schatten, Reflexionen und Texturen – berücksichtigt, um den Kontext des ursprünglichen Bildes beizubehalten.“

Der US-Künstler August Kamp verwendete Outpainting, um das berühmte Gemälde „Mädchen mit dem Perlenohrgehänge“ von Johannes Vermeer aus dem Jahr 1665 neu zu interpretieren.

Erstaunlicherweise gelang es dem Tool, einen Hintergrund zu erstellen, der den Malstil des Originals nachahmte.

Die Ergebnisse zeigen das berühmte Mädchen in einer häuslichen Umgebung, umgeben von Geschirr, Zimmerpflanzen, Obst, Kisten und mehr.

Es kontrastiert mit der Einfachheit von Vermeers Klassiker, der das Mädchen vor einem dunklen, leeren Hintergrund darstellt.

Andere Versuche sind etwas alberner – eines zeigt das Thema von Mona Lisa, die die Geste des Teufelshorns mit ihrer Hand macht, mit einem UFO und einem Killerroboter im Hintergrund, während eine Verlängerung Ausführung von A Friend In Need zeigt neben ihnen einen weiteren Tisch mit spielenden Eckzähnen.

Andere zeigt den Mann aus dem Quaker Oats-Logo mit kräftiger Oberweite und im Kleid, umgeben von Getränkeflaschen.

Eine erweiterte Ausführung von A Friend In Need zeigt neben ihnen einen weiteren Tisch mit spielenden Eckzähnen (im Bild das Original)

Andere Versuche sind etwas alberner – einer zeigt das Thema von Mona Lisa, die mit ihrer Hand die Geste des Teufelshorns macht (Original ist abgebildet)

Andere Versuche sind etwas alberner – eines zeigt das Motiv von Mona Lisa, die mit ihrer Hand die Geste des Teufelshorns macht (Original ist abgebildet)

Und noch ein anderes zeigt ein paar Leute, die zusammen mit den Beatles den berühmten Zebrastreifen vor Abbey Road Studies überqueren, mit verstreuten Herbstblättern, obwohl das Originalfoto im Hochsommer aufgenommen wurde.

Laut The Verge steht DALL-E mehr als 1 Million Menschen über ein Beta-Programm zur Verfügung, das den Benutzern eine bestimmte Menge an kostenlosen Bildgenerierungen bietet.

Menschen können sich auf der OpenAI-Website einer Warteliste anschließen, um „mit DALL-E zu erstellen“, obwohl das Unternehmen sagte, dass es „im Laufe der Zeit Einladungen verschickt“.

DALL-E ermöglicht bereits Änderungen innerhalb eines generierten oder hochgeladenen Bildes – eine Fähigkeit, die als Inpainting bekannt ist.

Es ist in der Lage, Details wie Schatten automatisch auszufüllen, wenn ein Objekt hinzugefügt wird, oder sogar den Hintergrund anzupassen, wenn ein Objekt verschoben oder entfernt wird.

DALL-E kann auch aus einer Textbeschreibung ein völlig neues Bild erzeugen, wie z. B. „ein Sessel in Form einer Avocado“ oder „eine Querschnittsansicht einer Walnuss“.

Ein weiteres klassisches Beispiel für die Arbeit von DALL-E sind „Teddybären, die mit Technologie der 1990er Jahre an neuer KI-Forschung unter Wasser arbeiten“.

DALL-E-Bild aus der Aufforderung „Teddybären arbeiten an neuer KI-Forschung unter Wasser mit Technologie der 1990er Jahre“

DALL-E-Bild aus der Aufforderung „Teddybären arbeiten an neuer KI-Forschung unter Wasser mit Technologie der 1990er Jahre“

OpenAI ist auch für KI-generiertes Audio bekannt.

Im Jahr 2020 enthüllte es Jukebox, ein neuronales Netzwerk, das unheimliche Annäherungen an Popsongs im Stil mehrerer Künstler generiert, darunter Elvis Presley, Frank Sinatra und David Bowie.

Das neuronale Netzwerk erzeugt Musik, einschließlich rudimentärem Gesang mit Texten in Englisch und einer Vielzahl von Instrumenten wie Gitarre und Klavier.

OpenAI kratzte 1,2 Millionen Songs, von denen 600.000 auf Englisch gesungen wurden, aus dem Internet und verknüpfte sie mit den Texten und Metadaten, die in die KI eingespeist wurden, um Annäherungen an die verschiedenen Künstler zu generieren.

WIE KÜNSTLICHE INTELLIGENZEN MIT NEURONALEN NETZWERKEN LERNEN

KI-Systeme stützen sich auf künstliche neuronale Netze (KNNs), die versuchen, die Funktionsweise des Gehirns zu simulieren, um zu lernen.

ANNs können darauf trainiert werden, Muster in Informationen zu erkennen – einschließlich Sprache, Textdaten oder visuellen Bildern – und sind die Grundlage für eine Vielzahl von Entwicklungen in der KI in den letzten Jahren.

Herkömmliche KI verwendet Eingaben, um einen Algorithmus über ein bestimmtes Thema zu „lehren“, indem sie ihn mit riesigen Mengen an Informationen füttert.

KI-Systeme stützen sich auf künstliche neuronale Netze (KNNs), die versuchen, die Funktionsweise des Gehirns zu simulieren, um zu lernen.  ANNs können darauf trainiert werden, Muster in Informationen zu erkennen – einschließlich Sprache, Textdaten oder visuellen Bildern

KI-Systeme stützen sich auf künstliche neuronale Netze (KNNs), die versuchen, die Funktionsweise des Gehirns zu simulieren, um zu lernen. ANNs können darauf trainiert werden, Muster in Informationen zu erkennen – einschließlich Sprache, Textdaten oder visuellen Bildern

Zu den praktischen Anwendungen gehören die Sprachübersetzungsdienste von Google, die Gesichtserkennungssoftware von Facebook und die bildverändernden Live-Filter von Snapchat.

Die Eingabe dieser Daten kann sehr zeitaufwändig sein und ist auf eine Art von Wissen beschränkt.

Eine neue Generation von ANNs namens Adversarial Neural Networks lässt den Verstand zweier KI-Bots gegeneinander antreten, wodurch sie voneinander lernen können.

Dieser Ansatz soll den Lernprozess beschleunigen und die von KI-Systemen erzeugte Ausgabe verfeinern.


source site

Leave a Reply