Leonardo D-AI Vinci? Das raffinierte KI-Tool verwandelt Ihre schlechten Skizzen in Sekundenschnelle in Kunstwerke – und das ohne Internet
- Qualcomm hat ein neues Modell vorgestellt, das Texte und Bilder in KI-Kunstwerke umwandelt
- ControlNet lädt keine Daten in die „Cloud“ hoch und benötigt keine Internetverbindung, um zu funktionieren
- Schlechte Skizzen können in knapp 12 Sekunden in Meisterwerke verwandelt werden
Viele von uns träumen irgendwann in ihrem Leben davon, Künstler zu werden, aber zwielichtige Skizzen können uns oft davon abhalten, dieses Ziel zu erreichen.
Nun könnten diese Träume bald wahr werden, denn dank der Kraft der künstlichen Intelligenz (KI) kann ein neues Werkzeug Ihre schlechten Kritzeleien in Meisterwerke verwandeln.
Der Technologieriese Qualcomm hat Anfang dieser Woche seine bahnbrechende ControlNet-Software vorgestellt, die Bildaufforderungen innerhalb von 12 Sekunden in alles umwandelt, was Sie möchten.
Im Gegensatz zu vielen anderen Modellen seiner Art – etwa Adobe AI Firefly – benötigt ControlNet überraschenderweise kein Internet, um zu funktionieren, und könnte bald eine wichtige Handy-App sein.
Obwohl es noch nicht veröffentlicht wurde, behauptet das Unternehmen, dass die Erstellung der Bilder hier völlig privat erfolgen wird und keine Daten in einer Cloud eines Drittanbieters gesichert werden.
Mit ControlNet können schlechte Skizzen in knapp 12 Sekunden in Meisterwerke verwandelt werden. In dieser Demonstration hat ein Benutzer eine Zeichnung eines Kätzchens eingegeben und das Modell mithilfe einer Textaufforderung aufgefordert, es „gelb“, „fotorealistisch“ und in „4K“-Qualität zu machen. Das endgültige Bild wird auf der rechten Seite angezeigt
„Generative KI hat die Welt im Sturm erobert und traditionelle Methoden zur Erstellung von Inhalten durcheinander gebracht“, sagte ein Qualcomm-Sprecher.
„ControlNet ermöglicht es Benutzern, eine Textbeschreibung eines Bildes sowie ein zusätzliches Bild einzugeben, um den Generierungsprozess zu steuern.“
ControlNet gehört zu einer Reihe ähnlicher KI-Tools dieser Art, die am häufigsten als Language-Vision-Modelle (LVMs) bezeichnet werden.
Diese kombinieren im Allgemeinen einen Bild-Encoder und einen Text-Encoder, um die vom Benutzer bereitgestellten Anweisungen zu lesen, bevor neue Inhalte erstellt werden.
Obwohl ControlNet noch nicht für die öffentliche Nutzung verfügbar ist, zeigen Demonstrationen, dass es Grafiken aus Textaufforderungen, Bildaufforderungen und beidem gleichzeitig erstellen kann.
Ausgewählte Bilder können alles sein, von persönlichen Zeichnungen bis hin zu Fotos, während Texteingaben angeben können, welchen Stil oder welches „Material“ die KI verwenden soll, um eine neue Version zu erstellen.
Zur Generierung eines Bildes könnte beispielsweise Wasser- oder Ölfarbe verwendet werden, das dann in 4K-Qualität dargestellt wird.
Da dieser Prozess ausschließlich auf einem bestimmten Gerät läuft, werden laut Qualcomm sowohl dessen Laufzeit als auch der Stromverbrauch deutlich reduziert.
Der Sprecher fügte hinzu: „Bilder werden in weniger als 12 Sekunden generiert, um ein interaktives Benutzererlebnis zu bieten, das zuverlässig und konsistent ist.“
„On-Device-KI bietet Vorteile in Bezug auf Kosten, Leistung, Personalisierung, Datenschutz und Sicherheit auf globaler Ebene.“
In dieser ControlNet-Demonstration hat ein Benutzer ein Foto von sich selbst eingegeben, und es scheint, dass das Modell gebeten wurde, ein Kunstwerk im antiken Stil anzufertigen
Es ist nicht klar, wann ControlNet für die öffentliche Nutzung verfügbar sein wird, aber es wird auf Telefonen nutzbar sein, wie in dieser Qualcomm-Demonstration gezeigt. Hier hat ein Benutzer die Bildaufforderung und die Textaufforderung genutzt und um ein „fotorealistisches“ 4K-Foto von ihm gebeten
Das neue Produkt von Qualcomm folgt auf eine Gegenreaktion auf KI-generierte Bildmodelle, bei der zahlreiche Künstler ihre Urheberrechtsbedenken geäußert haben.
Ausgelöst wurde dies vor allem durch die Disney-Illustratorin Hollie Mengert, nachdem sie herausfand, dass ihre Arbeit ohne Zustimmung zur Ausbildung eines neuen Models in Kanada verwendet wurde.
Viele haben seitdem über die Ethik der Verwendung von Kunstwerken zum Trainieren von KI debattiert, wobei die Legalität dieser Vorgehensweise weltweit ebenfalls eine Grauzone darstellt.
Es ist noch nicht klar, wessen Bilder zum Trainieren von ControlNet verwendet wurden, aber MailOnline hat sich für weitere Informationen an Qualcomm gewandt.