OpenAI hat mit seiner neuesten Innovation erneut für Aufsehen in der Technologiewelt gesorgt: GPT-4 mit Vision oder GPT-4V.
GPT-4-Vision zum Schreiben von Code mit einem Design: https://t.co/xJy9yFNvKG
– Greg Brockman (@gdb) 27. September 2023
GPT-4V baut auf GPT-4 auf und verfügt über visuelle Funktionen, die es dem Modell ermöglichen, Bilder zu analysieren, die von ChatGPT Plus- und Enterprise-Abonnenten bereitgestellt werden.
Einführung für zahlende Benutzer in den nächsten zwei Wochen!
– Greg Brockman (@gdb) 27. September 2023
Die neue Funktion hat großes Potenzial, birgt aber auch einige Risiken für Unternehmen.
GPT-4 mit Vision-Beispielen
Da immer mehr Benutzer Zugriff auf die neue Funktion erhalten, teilen sie Beispiele dafür, wie GPT-4 mit Vision funktioniert.
GPT-4 mit Vision kann Handschrift analysieren.
Ziemlich cool. KI kann Handschriften besser entziffern als ich.
Prof. Breen fragte, ob GPT-4 mit Vision das handgeschriebene Manuskript von Robert Boyle lesen kann. Es tut gut!
Für eine Reihe von akademischen Bereichen dürfte dies eine große Sache sein, insbesondere da die KI über den Text „überlegen“ kann. https://t.co/n9jUjqeEw3 pic.twitter.com/78jYWfIhCY
– Ethan Mollick (@emollick) 27. September 2023
Es kann mithilfe einer Serviettenzeichnung Code für eine Website erstellen.
Es ist unglaublich, wie Menschen GPT-4 mit Vision nutzen.
pic.twitter.com/1O3AW7DJDr— Hushen Savani (@hushensavani) 27. September 2023
Es kann Memes analysieren.
Das ist absolut wild. Ich bin völlig sprachlos. pic.twitter.com/wGTAx1hFgS
— Pietro Schirano (@skirano) 27. September 2023
Zusätzlich zu diesen Beispielen habe ich ein paar einfache Tests durchgeführt.
GPT-4 mit Vision kann Produktbeschreibungen für Ihre Verkaufsseiten und Amazon-Angebote schreiben.
Es kann Ihnen dabei helfen, anhand eines Screenshots mit der grundlegenden Codierung für ein bestimmtes Website-Design zu beginnen.
Es kann kreative Instagram-Untertitel mit Hashtag-Vorschlägen schreiben.
Es kann einen Artikel basierend auf Daten einer Website oder eines E-Books schreiben, beispielsweise „State of SEO 2024“.
Wie bei allen KI-generierten Inhalten ist es wichtig, die Ausgabe von GPT-4 mit Vision auf Genauigkeit zu überprüfen. Es halluziniert immer noch und birgt andere Risiken.
OpenAI enthüllt potenzielle Risiken von GPT-4V
OpenAI hat ein Papier veröffentlicht, in dem potenzielle Risiken im Zusammenhang mit der Verwendung von GPT-4V dargelegt werden, darunter:
- Datenschutzrisiken durch die Identifizierung von Personen auf Bildern oder die Bestimmung ihres Standorts können Auswirkungen auf die Datenpraktiken und Compliance von Unternehmen haben. In dem Papier wird darauf hingewiesen, dass GPT-4V in gewisser Weise in der Lage ist, Persönlichkeiten des öffentlichen Lebens zu identifizieren und Bilder zu geolokalisieren.
- Mögliche Verzerrungen bei der Bildanalyse und -interpretation könnten sich negativ auf verschiedene demografische Gruppen auswirken.
- Sicherheitsrisiken durch die Bereitstellung ungenauer oder unzuverlässiger medizinischer Ratschläge, spezifischer Anweisungen für gefährliche Aufgaben oder hasserfüllter/gewalttätiger Inhalte.
- Cybersicherheitslücken wie das Lösen von CAPTCHAs oder multimodale Jailbreaks.
Die vom Modell ausgehenden Risiken haben zu Einschränkungen geführt, beispielsweise zu der Weigerung, eine Analyse von Bildern mit Personen anzubieten.
Insgesamt müssen Marken, die GPT-4V für Marketingzwecke nutzen möchten, diese und andere Risiken der generativen KI-Nutzung bewerten und mindern, um die Technologie verantwortungsvoll zu nutzen und negative Auswirkungen auf Verbraucher und den Ruf der Marke zu vermeiden.
OpenAIs erster Partner bereitet Bildeingaben für eine „größere Verfügbarkeit“ vor
OpenAI gab bekannt, dass das GPT-4 mit Vision-Modell Be My Eyes Virtual Volunteer unterstützen wird, einen digitalen visuellen Assistenten für Sehbehinderte.
Obwohl sich die Technologie noch in der Beta-Phase befindet, sind die Möglichkeiten verlockend. Beispielsweise könnte diese Technologie Unternehmen dabei unterstützen, die Zugänglichkeit im Kundenservice zu verbessern.
Be My Eyes plant, die Funktion mit Firmenkunden im Betatest zu testen und dabei ihr kommerzielles Potenzial über die primäre Zielgruppe hinaus hervorzuheben.
Die Zukunft von GPT-4 mit Vision
Die potenziellen Anwendungen von GPT-4 With Vision für Unternehmen, Vermarkter und SEO-Experten könnten bahnbrechend sein.
Aufgrund der potenziellen Datenschutz-, Fairness- und Cybersicherheitsprobleme, die GPT-4 mit Vision und anderen KI-Modellen mit sich bringt, sollten jedoch alle Benutzer vorsichtig bleiben.
Ausgewähltes Bild: Tada Images/Shutterstock