OpenAI hat sein KI-Modell Sora, das Text-zu-Video umsetzt, während der Shipmas-Veranstaltung veröffentlicht. Aktuell steht es nur ChatGPT Pro- und Plus-Nutzern zur Verfügung. Trotz beeindruckender Fähigkeiten gibt es Herausforderungen bei der realistischen Videoproduktion. Das Modell könnte mit Inhalten aus Videospielen und Twitch-Streams trainiert worden sein. Urheberrechtsfragen sind ein zentrales Thema, da das Modell stark gefiltert wird, um rechtliche Probleme zu vermeiden. Bedenken hinsichtlich der Trainingsquellen wurden von verschiedenen Experten geäußert.
OpenAI’s Sora KI-Modell: Ein Blick auf die Neuheiten
OpenAI hat kürzlich sein beeindruckendes Text-zu-Video KI-Modell namens Sora im Rahmen seiner festlichen 12-tägigen Shipmas-Veranstaltung für die Öffentlichkeit zugänglich gemacht. Zuvor wurde das Modell bereits im Februar dieses Jahres in einer Vorabversion vorgestellt. Momentan ist das Tool ausschließlich für ChatGPT Pro- und Plus-Nutzer verfügbar, wobei es bisher keine Anzeichen dafür gibt, dass es bald auch für kostenlose Nutzer zugänglich gemacht wird.
Trotz der bemerkenswerten Fähigkeiten des Sora-Modells hat OpenAI auf einige kritische Leistungsprobleme hingewiesen, insbesondere im Zusammenhang mit der Erstellung von Videos. Das KI-Modell hat Schwierigkeiten, realistische physikalische Effekte darzustellen, insbesondere bei komplexen Aktionen über längere Zeiträume, auch wenn es von dem leistungsstarken Sora Turbo KI-Modell unterstützt wird.
Das Trainingsmaterial: Von Videospielen zu Twitch-Streams
OpenAI hat bislang keine detaillierten Informationen zu den Trainingsdaten des Sora-Modells veröffentlicht. Berichten zufolge könnte das Modell jedoch mit Inhalten aus Videospielen trainiert worden sein. Bei der Präsentation im Februar war bereits erkennbar, dass Minecraft-Videos eine Rolle spielten. Es scheint jedoch, dass Minecraft nicht die einzige Inspirationsquelle ist. Auch Klassiker wie Super Mario Bros, Call of Duty, Counter-Strike und sogar eine Version von Teenage Mutant Ninja Turtles aus den 90er Jahren könnten Teil des Trainingsrepertoires von Sora sein.
Darüber hinaus deuten Hinweise darauf hin, dass Twitch-Streams ebenfalls in das Trainingsmaterial integriert sein könnten. Ein Screenshot, der von TechCrunch geteilt wurde, zeigt, dass das Modell ein gutes Verständnis dafür hat, wie ein typischer Twitch-Stream aussieht, was darauf hinweist, dass Inhalte dieser Plattform zur Schulung verwendet wurden. Besonders bemerkenswert ist, dass das KI-Modell Videos mit bekannten Twitch-Streamern wie Raúl Álvarez Genes (Auronplay) generiert.
Um Urheberrechtsprobleme zu vermeiden, wird das Modell intensiv gefiltert. So wird beispielsweise eine direkte Anfrage, einen Clip mit einem urheberrechtlich geschützten Charakter zu erstellen, sofort abgelehnt. Dies erfordert von den Nutzern Kreativität bei der Formulierung ihrer Eingaben.
OpenAI und Microsoft sind bereits mit Herausforderungen im Bereich Urheberrechtsverletzungen konfrontiert worden. Sam Altman, CEO von OpenAI, erklärte, dass die Entwicklung von Tools wie ChatGPT ohne geschützte Inhalte nahezu unmöglich sei. Er wies darauf hin, dass das Urheberrecht nicht grundsätzlich die Nutzung geschützter Inhalte für die Ausbildung von KI-Modellen verbietet.
In einem Gespräch mit TechCrunch äußerte der IP-Anwalt Joshua Weigensberg Bedenken hinsichtlich der Risiken, die Unternehmen eingehen, wenn sie mit nicht lizenzierten Videospielinhalten trainieren. Er betonte, dass das Training generativer KI-Modelle oft das Kopieren der Trainingsdaten beinhaltet, wodurch die Wahrscheinlichkeit steigt, dass urheberrechtlich geschützte Materialien enthalten sind.
Der bekannte YouTuber Marques Brownlee äußerte kürzlich Bedenken hinsichtlich der Trainingsquellen von Sora, nachdem er frühzeitig Zugang zu dem Tool erhalten hatte. Bei einem Test bat er Sora, ein Video eines Technik-Reviewers zu erstellen, der über ein Smartphone spricht. Das Ergebnis erregte seine Aufmerksamkeit, insbesondere die Pflanze auf dem Schreibtisch, die auffällig ähnlich der in vielen seiner eigenen Videos war.
Obwohl dieses KI-generierte Video nicht als definitiver Beweis für eine Inspiration aus Brownlees Inhalten gewertet werden kann, wirft es dennoch Fragen auf und könnte für zukünftige Beobachtungen von Interesse sein.
Die ehemalige CTO von OpenAI, Mira Murati, wurde ebenfalls gefragt, ob Sora mit Inhalten von Plattformen wie YouTube, Instagram und Facebook trainiert wurde. Sie konnte jedoch keine klare Antwort geben und erklärte lediglich, dass das Modell mit öffentlich verfügbaren und lizenzierten Daten, einschließlich Stock-Medien von Shutterstock, geschult werde. TechCrunch erhielt keine weiteren Informationen von OpenAI, außer dem Hinweis, dass man sich mit dem Team abstimmen würde.