Das raffinierte KI-Tool verwandelt Ihre schlechten Skizzen in Sekundenschnelle in Kunstwerke – und das ohne Internet

Leonardo D-AI Vinci? Das raffinierte KI-Tool verwandelt Ihre schlechten Skizzen in Sekundenschnelle in Kunstwerke – und das ohne Internet

  • Qualcomm hat ein neues Modell vorgestellt, das Texte und Bilder in KI-Kunstwerke umwandelt
  • ControlNet lädt keine Daten in die „Cloud“ hoch und benötigt keine Internetverbindung, um zu funktionieren
  • Schlechte Skizzen können in knapp 12 Sekunden in Meisterwerke verwandelt werden

Viele von uns träumen irgendwann in ihrem Leben davon, Künstler zu werden, aber zwielichtige Skizzen können uns oft davon abhalten, dieses Ziel zu erreichen.

Nun könnten diese Träume bald wahr werden, denn dank der Kraft der künstlichen Intelligenz (KI) kann ein neues Werkzeug Ihre schlechten Kritzeleien in Meisterwerke verwandeln.

Der Technologieriese Qualcomm hat Anfang dieser Woche seine bahnbrechende ControlNet-Software vorgestellt, die Bildaufforderungen innerhalb von 12 Sekunden in alles umwandelt, was Sie möchten.

Im Gegensatz zu vielen anderen Modellen seiner Art – etwa Adobe AI Firefly – benötigt ControlNet überraschenderweise kein Internet, um zu funktionieren, und könnte bald eine wichtige Handy-App sein.

Obwohl es noch nicht veröffentlicht wurde, behauptet das Unternehmen, dass die Erstellung der Bilder hier völlig privat erfolgen wird und keine Daten in einer Cloud eines Drittanbieters gesichert werden.

Mit ControlNet können schlechte Skizzen in knapp 12 Sekunden in Meisterwerke verwandelt werden. In dieser Demonstration hat ein Benutzer eine Zeichnung eines Kätzchens eingegeben und das Modell mithilfe einer Textaufforderung aufgefordert, es „gelb“, „fotorealistisch“ und in „4K“-Qualität zu machen. Das endgültige Bild wird auf der rechten Seite angezeigt

WAS IST DIE WOLKE?

Die Cloud bezieht sich auf Server, die sich in Rechenzentren auf der ganzen Welt befinden, aber über das Internet zugänglich sind.

Wenn Unternehmen Cloud Computing nutzen, müssen sie diese Server nicht selbst verwalten oder stromintensive Software auf ihren Maschinen ausführen.

Die Cloud ermöglicht Benutzern außerdem den Zugriff auf ihre Dateien von fast jedem Gerät aus, da ihre Daten in einem bestimmten Zentrum und nicht auf dem eigenen Gerät gespeichert werden.

Auf diese Weise können Social-Media-Kontodaten, wie z. B. Instagram-Logins, sehr schnell von einem kaputten Telefon auf ein neues übertragen werden.

Quelle: Cloudfare

„Generative KI hat die Welt im Sturm erobert und traditionelle Methoden zur Erstellung von Inhalten durcheinander gebracht“, sagte ein Qualcomm-Sprecher.

„ControlNet ermöglicht es Benutzern, eine Textbeschreibung eines Bildes sowie ein zusätzliches Bild einzugeben, um den Generierungsprozess zu steuern.“

ControlNet gehört zu einer Reihe ähnlicher KI-Tools dieser Art, die am häufigsten als Language-Vision-Modelle (LVMs) bezeichnet werden.

Diese kombinieren im Allgemeinen einen Bild-Encoder und einen Text-Encoder, um die vom Benutzer bereitgestellten Anweisungen zu lesen, bevor neue Inhalte erstellt werden.

Obwohl ControlNet noch nicht für die öffentliche Nutzung verfügbar ist, zeigen Demonstrationen, dass es Grafiken aus Textaufforderungen, Bildaufforderungen und beidem gleichzeitig erstellen kann.

Ausgewählte Bilder können alles sein, von persönlichen Zeichnungen bis hin zu Fotos, während Texteingaben angeben können, welchen Stil oder welches „Material“ die KI verwenden soll, um eine neue Version zu erstellen.

Zur Generierung eines Bildes könnte beispielsweise Wasser- oder Ölfarbe verwendet werden, das dann in 4K-Qualität dargestellt wird.

Da dieser Prozess ausschließlich auf einem bestimmten Gerät läuft, werden laut Qualcomm sowohl dessen Laufzeit als auch der Stromverbrauch deutlich reduziert.

Der Sprecher fügte hinzu: „Bilder werden in weniger als 12 Sekunden generiert, um ein interaktives Benutzererlebnis zu bieten, das zuverlässig und konsistent ist.“

„On-Device-KI bietet Vorteile in Bezug auf Kosten, Leistung, Personalisierung, Datenschutz und Sicherheit auf globaler Ebene.“

In dieser ControlNet-Demonstration hat ein Benutzer ein Foto von sich selbst eingegeben, und es scheint, dass das Modell gebeten wurde, ein Kunstwerk im antiken Stil anzufertigen

In dieser ControlNet-Demonstration hat ein Benutzer ein Foto von sich selbst eingegeben, und es scheint, dass das Modell gebeten wurde, ein Kunstwerk im antiken Stil anzufertigen

Es ist nicht klar, wann ControlNet für die öffentliche Nutzung verfügbar sein wird, aber es wird auf Telefonen nutzbar sein, wie in dieser Qualcomm-Demonstration gezeigt.  Hier hat ein Benutzer die Bildaufforderung und die Textaufforderung genutzt und um ein „fotorealistisches“ 4K-Foto von ihm gebeten

Es ist nicht klar, wann ControlNet für die öffentliche Nutzung verfügbar sein wird, aber es wird auf Telefonen nutzbar sein, wie in dieser Qualcomm-Demonstration gezeigt. Hier hat ein Benutzer die Bildaufforderung und die Textaufforderung genutzt und um ein „fotorealistisches“ 4K-Foto von ihm gebeten

Das neue Produkt von Qualcomm folgt auf eine Gegenreaktion auf KI-generierte Bildmodelle, bei der zahlreiche Künstler ihre Urheberrechtsbedenken geäußert haben.

Ausgelöst wurde dies vor allem durch die Disney-Illustratorin Hollie Mengert, nachdem sie herausfand, dass ihre Arbeit ohne Zustimmung zur Ausbildung eines neuen Models in Kanada verwendet wurde.

Viele haben seitdem über die Ethik der Verwendung von Kunstwerken zum Trainieren von KI debattiert, wobei die Legalität dieser Vorgehensweise weltweit ebenfalls eine Grauzone darstellt.

Es ist noch nicht klar, wessen Bilder zum Trainieren von ControlNet verwendet wurden, aber MailOnline hat sich für weitere Informationen an Qualcomm gewandt.

Die Text-zu-Bild-KI „DALL-E“ kann sich jetzt vorstellen, was außerhalb des Rahmens berühmter Gemälde liegt

OpenAI, ein in San Francisco ansässiges Unternehmen, hat ein neues Tool namens „Outpainting“ für sein Text-zu-Bild-KI-System DALL-E entwickelt.

Outpainting ermöglicht es dem System, sich vorzustellen, was außerhalb des Rahmens berühmter Gemälde wie „Das Mädchen mit dem Perlenohrring“, „Mona Lisa“ und „Hunde spielen Poker“ liegt.

Wie Benutzer gezeigt haben, ist dies mit jeder Art von Bild möglich, beispielsweise mit dem Mann auf dem Quaker Oats-Logo und dem Cover des Beatles-Albums „Abbey Road“.

DALL-E basiert auf künstlichen neuronalen Netzen (ANNs), die Simulieren Sie die Funktionsweise des Gehirns, um zu lernen und aus Text ein Bild zu erstellen.

DALL-E ermöglicht bereits Änderungen innerhalb eines generierten oder hochgeladenen Bildes – eine Funktion, die als Inpainting bekannt ist.

Es ist in der Lage, Details wie Schatten automatisch auszufüllen, wenn ein Objekt hinzugefügt wird, oder sogar den Hintergrund entsprechend anzupassen, wenn ein Objekt verschoben oder entfernt wird.

DALL-E kann aus einer Textbeschreibung auch ein völlig neues Bild erzeugen, etwa „ein Sessel in Form einer Avocado“ oder „eine Querschnittsansicht einer Walnuss“.

Ein weiteres klassisches Beispiel für die Arbeit von DALL-E sind „Teddybären, die unter Wasser mit der Technologie der 1990er Jahre an neuer KI-Forschung arbeiten“.

Weiterlesen

source site

Leave a Reply