Wann Der Atlantik Im vergangenen Monat wurde bekannt, dass Zehntausende Bücher, die in den letzten 20 Jahren veröffentlicht wurden, ohne Erlaubnis zum Trainieren des KI-Sprachmodells von Meta verwendet wurden, so bekannte Autoren empörtnannte es einen „rauchenden Beweis“ für Fehlverhalten von Megakonzernen. Nachdem das Magazin nun eine durchsuchbare Datenbank mit betroffenen Büchern veröffentlicht hat, ist die Empörung noch größer: „Ich hätte niemals zugestimmt, dass Meta KI für eines meiner Bücher trainiert, geschweige denn für fünf davon“, schrieb die Schriftstellerin Lauren Groff. „Hyperventilieren.“ Das Original atlantisch Die Geschichte deutete auf dieses Gefühl der Verletzung und Beleidigung hin: „Die von der KI versprochene Zukunft ist mit gestohlenen Worten geschrieben“, hieß es.
Ich verstehe, dass die fragliche Datenbank mit dem Namen „Books3“ offenbar aus per Torrent heruntergeladenen E-Books zusammengestellt wurde, die in Textdateien gerippt wurden. In diesem Fall könnte jede Verwendung derselben eine Verletzung des Urheberrechts darstellen. Dennoch war ich zunächst verwirrt über die Reaktion des Sturm und Drang und über die Behauptung, dass generative KI „durch Massendiebstahl angetrieben“ werde. Vielleicht war ich einfach nur neidisch auf die berühmten Schriftsteller, die als Opfer herausgegriffen wurden – Stephen King, Zadie Smith, Michael Pollan und andere, die hohe Rednerhonorare und lukrative Zweitrechtsverträge erzielen. Vielleicht sollte ich die Befürchtungen der Autoren besser verstehen, dachte ich, wenn auch meine Arbeit raubkopiert und für KI-Leistungen genutzt würde.
Jetzt weiß ich, dass es so ist. Gestern, als ich meinen Namen eingegeben habe Der AtlantikBei der Datenbanksuche wurden drei der zehn Bücher angezeigt, die ich als Autor oder Co-Autor verfasst habe. Wie aufregend! Ich hatte mich den Reihen der Geschädigten angeschlossen. Aber dann war ich trotz einiger Bemühungen enttäuschenderweise nicht betrübt. Was zum Teufel war mit mir los?
Autoren, die wütend sind – Autoren, die es sind verdammt wütend– haben darauf hingewiesen, dass ihre Arbeit ohne Verwendung verwendet wurde Erlaubnis. Das ist auch der Kern einer in Kalifornien eingereichten Klage der Komikerin Sarah Silverman und zweier weiterer Autoren, Richard Kadrey und Christopher Golden, in der behauptet wird, Meta habe es versäumt, ihre Zustimmung einzuholen, bevor sie Ausschnitte aus ihrem Text, sogenannte „Tokens“, extrahierte. zur Verwendung beim Unterrichten seiner KI. Das Unternehmen nutzte seine Bücher auf eine Art und Weise, mit der die Autoren nicht gerechnet hatten, und bei näherer Betrachtung auch auf eine Art und Weise, die sie nicht gutheißen. (Meta hat einen Antrag auf Abweisung der Klage eingereicht.)
Ob das Verhalten von Meta einen Verstoß darstellt oder nicht, ist Sache der Gerichte. Die Erlaubnis ist eine andere Sache. Eine der Tatsachen (und Freuden) der Autorenschaft besteht darin, dass die eigene Arbeit auf unvorhersehbare Weise verwendet wird. Der Philosoph Jacques Derrida sprach gern von „Verbreitung“, womit ich meine, dass sich ein Autor wie eine Pflanze, die ihren Samen freisetzt, von ihrem veröffentlichten Werk trennt. Ihre Leser (oder Zuschauer oder Zuhörer) können und müssen dieses Werk in verschiedenen Kontexten verstehen. Ein Rentner liest einen von einem Enkelkind empfohlenen Roman von Haruki Murakami. Ein High-School-Kind überfliegt Shakespeare für eine Unterrichtsstunde. Auf ihren Vorschlag hin liest der Baumpfleger meiner Mutter mein Spielbuch vor. Allen diesen Nutzungen liegt, wie auch der Beeinflussung im Allgemeinen, ein Mangel an Erlaubnis zugrunde: Wenn Kunst erfolgreich ist, übersteigt sie die Pläne ihres Schöpfers.
Doch in der Internetkultur wird Erlaubnis zu einem moralischen Recht. Viele Autoren sind online und können Ihnen sagen, ob und wann Sie mit ihrer Arbeit falsch liegen. Auch online gibt es Scharen von Fans, die ihre bisherigen Vorstellungen davon, was ein Buch, ein Film oder ein Album wirklich bedeutet, propagieren und die „falschen“ Darstellungen ausmerzen. Das Books3-Imbroglio spiegelt den gleichen Impuls wider, zu glauben, dass manche Interpretationen eines Werks tabu sind.
Vielleicht ist Meta ein unattraktiver Leser. Vielleicht möchte ich nicht gelesen werden, wenn ich Prosa in Stücke zerlege. Aber wer bin ich dann, um zu sagen, wofür meine Arbeit gut ist und welchen Nutzen sie jemandem bringen könnte – selbst einem Unternehmen mit einem Umsatz von fast einer Billion Dollar? Diese eine unerwartete Verwendung meines Schreibens zu beklagen bedeutet, alle anderen unerwarteten Verwendungen dafür zu untergraben. Als Schriftsteller fühle ich mich dadurch schlecht.
Ich fühle mich auch – darf ich das sagen? – ein wenig gelangweilt von der Idee, die Meta hat mein Leben gestohlen. Wenn der Diebstahl und die Aggregation der Werke in Books3 aus moralischen oder rechtlichen Gründen verwerflich sind, dann sollte dies unabhängig von der Aufnahme dieser Werke in das große Sprachmodell eines bestimmten Technologieunternehmens der Fall sein. Aber das scheint nicht der Fall zu sein. Die Books3-Datenbank selbst wurde im Widerstand gegen die Konzernmoloche hochgeladen. Die Person, die zuerst habe das Repository gepostet hat es als die einzige Möglichkeit für Open-Source-Basis-KI-Projekte beschrieben, mit großen kommerziellen Unternehmen zu konkurrieren. Er versuchte, den einfachen Menschen, einschließlich Buchautoren, einen Teil der Kontrolle über die Zukunft zurückzugeben. In der Zwischenzeit behauptet Meta, dass die nächste Generation seines KI-Modells – das möglicherweise immer noch Books3 in seine Trainingsdaten einbezieht – „kostenlos für Forschung und kommerzielle Nutzung“ sei, eine Aussage, die einer genauen Prüfung bedarf, diese Saga aber auch verkompliziert. Das Gleiche gilt für die Tatsache, dass Stunden danach Der Atlantik ein Suchtool für Books3 veröffentlicht hat, hat ein Autor einen Link verteilt, der es Ihnen ermöglicht, auf die Funktion zuzugreifen, ohne dieses Magazin zu abonnieren. Mit anderen Worten: eine kostenlose Möglichkeit für Menschen, sich darüber zu empören, dass Menschen die Arbeit von Autoren umsonst bekommen.
Ich bin mir nicht sicher, was ich von all dem halte, als Bürger der Zukunft ebenso wie als Buchautor. Diebstahl ist eine Erbsünde des Internets. Manchmal nennen wir es Piraterie (wenn Software auf USENET hochgeladen wird oder Bücher auf Books3 hochgeladen werden); ein anderes Mal wird es als Innovation (wenn Google das gesamte Internet ohne Erlaubnis verarbeitet und indiziert) oder sogar als Befreiung angesehen. KI iteriert lediglich diese Mehrdeutigkeit. Es fällt mir schwer, neuartige oder endgültige Schlussfolgerungen über die Books3-Geschichte zu ziehen, die auf dem althergebrachten Wissen basieren, in das einige meiner Texte, zusammen mit Billionen weiterer Wortblöcke, vielleicht aus Amazon-Rezensionen und Reddit-Hühnern, Eingang gefunden haben ein KI-Trainingsset.
Was ist eigentlich mit diesen Amazon-Rezensenten und Redditoren? Was ist mit den Wikipedia-Autoren, die sich die Mühe gemacht haben, die Seiten für die Bratz-Puppen und die Bosc-Birne zu schreiben, oder den Bloggern, deren Blogs schon lange aufgegeben wurden, oder den Textern für Unternehmensbroschüren oder, was soll’s, sogar den Müllkippern, die Suchmaschinenoptimierung betreiben? Ihre gesamte Arbeit wurde oder wird wahrscheinlich auch in die riesigen Sprachmodelle integriert. Die Gesamtmenge an Textmaterial, das für das Training von KI-Modellen zugänglich ist und abgerufen wird, lässt Bücher – selbst fast 200.000 davon – im Vergleich dazu wie einen winzigen Fleck erscheinen.
Es ist meiner Meinung nach verständlich, dass man literarischen Werken mehr Wertschätzung entgegenbringt als Einführungen in Bananenbrotrezepte oder Subreddit-Posts „Am I the Asshole“ oder Anweisungen zum Austausch von Wassereinlassventilen. Aber es ist auch anmaßend. Wir, die Zeitschriften und Bücher schreiben und veröffentlichen, sind Fachleute, denen die Bedeutung der Autorenschaft persönlich am Herzen liegt. Wir sind auch zahlenmäßig wenige. Fast jeder kann über Jahre hinweg Millionen von Wörtern in sozialen Medien, in Texten und E-Mails, in Berichten und Memos für seine Arbeit schreiben. Ich liebe Bücher und respektiere sie, aber als veröffentlichte Autorin und professionelle Autorin gehöre ich vielleicht in diese Kategorie am wenigsten Ich laufe Gefahr, den Bezug zum geschriebenen Wort und seiner Beute zu verlieren. Wenn eine KI-Collage aus Stephen King und Yelp besser abschneiden kann als ich, was habe ich dann überhaupt für ein Recht, mich selbst als Autor zu bezeichnen?
Ich bin Autorin geworden, weil die Sprache ein besonderes Medium zum Experimentieren mit Ideen bietet. Wörter und Sätze sind formbar. Texte entstehen aus Kellern von Subtext. Was ich sage, umfasst das, was ich nicht sage, und schafft Raum für das, was Sie lesen. Sobald meine Bücher gebunden und veröffentlicht, verpackt und verschickt sind, finden sie ihren Weg an Orte, mit denen ich vielleicht nie gerechnet hätte. Als Behälter für Ideen, so hoffe ich, aber auch als Türstopper oder Geräte zur Insektenvernichtung oder als letzter Zentimeter eines Stapels, der einen Laptop für einen wichtigen Zoom trägt. Oder sogar – sogar! – als eine Litanei von Spielsteinen, die in Stücke gerissen werden, um vom außerirdischen Geist einer seltsamen Maschine wieder zusammengesetzt zu werden. Warum nicht? Ich bin zwar ein Autor, aber ich bin auch ein Mann, der einige Wörter in eine Reihe bringt, inmitten unzähliger anderer, die das Gleiche getan haben. Wenn Autorenschaft nichts anderes als Eitelkeit ist, dann lassen Sie uns von den Maschinen aus unserem Elend erlösen.