Metas neuer KI-Assistent trainierte an öffentlichen Facebook- und Instagram-Posts

MENLO PARK, Kalifornien, 28. September (Reuters) – Meta Platforms (META.O) nutzte öffentliche Facebook- und Instagram-Posts, um Teile seines neuen virtuellen Assistenten Meta AI zu trainieren, schloss jedoch private Posts aus, die nur mit Familie und Freunden geteilt wurden, um Respekt zu zeigen Die Privatsphäre der Verbraucher sei geschützt, sagte der oberste Richtlinienmanager des Unternehmens in einem Interview mit Reuters.

Meta nutzte auch keine privaten Chats in seinen Messaging-Diensten als Trainingsdaten für das Modell und unternahm Schritte, um private Details aus öffentlichen Datensätzen zu filtern, die für das Training verwendet wurden, sagte Nick Clegg, President of Global Affairs bei Meta, am Rande der jährlichen Connect-Konferenz des Unternehmens diese Woche.

„Wir haben versucht, Datensätze auszuschließen, die einen hohen Anteil an persönlichen Informationen enthalten“, sagte Clegg und fügte hinzu, dass die „überwiegende Mehrheit“ der von Meta für das Training verwendeten Daten öffentlich verfügbar sei.

Er nannte LinkedIn als Beispiel für eine Website, deren Inhalte Meta aus Datenschutzgründen bewusst nicht nutzte.

Cleggs Kommentare kommen zu einem Zeitpunkt, an dem Technologieunternehmen wie Meta, OpenAI und Google (togetL.O) von Alphabet dafür kritisiert wurden, dass sie aus dem Internet gesammelte Informationen ohne Genehmigung zum Trainieren ihrer KI-Modelle verwenden, die riesige Datenmengen aufnehmen, um Informationen zusammenzufassen und Bilder zu generieren .

Die Unternehmen überlegen, wie sie mit den privaten oder urheberrechtlich geschützten Materialien umgehen sollen, die bei diesem Prozess aufgesaugt werden und von ihren KI-Systemen reproduziert werden könnten, und sehen sich gleichzeitig mit Klagen von Autoren konfrontiert, die ihnen Urheberrechtsverletzungen vorwerfen.

Meta AI war das bedeutendste Produkt unter den ersten verbraucherorientierten KI-Tools des Unternehmens, die CEO Mark Zuckerberg am Mittwoch auf Metas jährlicher Produktkonferenz Connect vorgestellt hatte. Die diesjährige Veranstaltung stand ganz im Zeichen der künstlichen Intelligenz, im Gegensatz zu früheren Konferenzen, die sich auf Augmented und Virtual Reality konzentrierten.

Meta habe den Assistenten mithilfe eines benutzerdefinierten Modells erstellt, das auf dem leistungsstarken großen Sprachmodell Llama 2 basiert, das das Unternehmen im Juli für die öffentliche kommerzielle Nutzung freigegeben hat, sowie eines neuen Modells namens Emu, das Bilder als Reaktion auf Textaufforderungen generiert, hieß es.

Das Produkt wird in der Lage sein, Text, Audio und Bilder zu generieren und über eine Partnerschaft mit der Bing-Suchmaschine von Microsoft (MSFT.O) Zugriff auf Echtzeitinformationen zu haben.

Die öffentlichen Facebook- und Instagram-Posts, die zum Trainieren von Meta AI verwendet wurden, enthielten sowohl Text als auch Fotos, sagte Clegg.

Diese Beiträge wurden verwendet, um Emu für die Bilderzeugungselemente des Produkts zu trainieren, während die Chat-Funktionen auf Llama 2 basierten und einige öffentlich verfügbare und kommentierte Datensätze hinzugefügt wurden, sagte ein Meta-Sprecher gegenüber Reuters.

Interaktionen mit Meta AI könnten auch genutzt werden, um die Funktionen in Zukunft zu verbessern, sagte der Sprecher.

Clegg sagte, Meta habe Sicherheitsbeschränkungen für die Inhalte eingeführt, die das Meta-KI-Tool generieren könne, etwa ein Verbot der Erstellung fotorealistischer Bilder von Persönlichkeiten des öffentlichen Lebens.

In Bezug auf urheberrechtlich geschütztes Material sagte Clegg, er erwarte eine „ziemliche Menge an Rechtsstreitigkeiten“ über die Frage, „ob kreative Inhalte unter die bestehende Fair-Use-Doktrin fallen oder nicht“, die die begrenzte Nutzung geschützter Werke für Zwecke wie Kommentare und Forschung erlaubt und Parodie.

„Wir glauben, dass dies der Fall ist, aber ich vermute stark, dass sich dies in einem Rechtsstreit auswirken wird“, sagte Clegg.

Einige Unternehmen ermöglichen mit Tools zur Bildgenerierung die Reproduktion ikonischer Charaktere wie Mickey Mouse, während andere für die Materialien bezahlt oder bewusst darauf verzichtet haben, sie in Trainingsdaten aufzunehmen.

OpenAI beispielsweise hat diesen Sommer einen Sechsjahresvertrag mit dem Content-Anbieter Shutterstock unterzeichnet, um die Bild-, Video- und Musikbibliotheken des Unternehmens für Schulungen zu nutzen.

Auf die Frage, ob Meta solche Schritte unternommen habe, um die Reproduktion urheberrechtlich geschützter Bilder zu verhindern, verwies ein Meta-Sprecher auf neue Nutzungsbedingungen, die es Benutzern verbieten, Inhalte zu erstellen, die die Privatsphäre und Rechte an geistigem Eigentum verletzen.

Berichterstattung von Katie Paul in Menlo Park, Kalifornien; Bearbeitung durch Kenneth Li, Matthew Lewis und Lincoln Feast

Unsere Standards: Die Thomson Reuters Trust Principles.

Erwerben Sie Lizenzrechteöffnet neuen Tab

source site

Leave a Reply