Tag: Trainingsdaten
Der Download: Die verunreinigten chinesischen Trainingsdaten von GPT-4o und die KI-Herausforderung der Astronomie
Kurz nachdem OpenAI letzten Montag GPT-4o veröffentlicht hatte, bemerkten einige Chinesischsprachige, dass etwas an dieser neuesten Version des Chatbots nicht stimmte: Die Token, die er zum Parsen von Texten verwendet, waren voller Spam und pornografischer Phrasen.
Menschen lesen in Worten, LLMs hingegen lesen in Tokens, das sind unterschiedliche Einheiten in einem Satz, die konsistente und bedeutsame Bedeutungen haben. GPT-4o soll bei der Bewältigung mehrsprachiger Aufgaben besser sein als seine Vorgänger, und viele der Fortschritte wurden durch ein neues Tokenisierungstool erzielt,
Der Roboterwettlauf entfacht einen Kampf um Trainingsdaten
„Viele Leute überlegen, was die nächste große Datenquelle sein wird“, sagt Pras Velagapudi, Chief Technology Officer von Agility Robotics, einem Unternehmen, das einen humanoiden Roboter herstellt, der in Lagerhäusern für Kunden wie Amazon arbeitet. Die Antworten auf Velagapudis Frage werden dazu beitragen, zu definieren, worin die Maschinen von morgen herausragende Leistungen erbringen und welche Rollen sie in unserem Zuhause und am Arbeitsplatz einnehmen könnten.
Erstklassige Trainingsdaten
Um zu verstehen, wie Robotiker nach Daten suchen, stellen Sie sich eine Metzgerei vor.
Der Fehler, der die generative KI ruinieren könnte
Anfang dieser Woche wurde die Telegraph berichtete über ein merkwürdiges Eingeständnis von OpenAI, dem Erfinder von ChatGPT. In einer dem britischen Parlament vorgelegten Einreichung erklärte das Unternehmen, dass „führende KI-Modelle“ ohne uneingeschränkten Zugang zu urheberrechtlich geschützten Büchern und Artikeln nicht existieren könnten, und bestätigte damit, dass die generative KI-Branche, die mehrere zehn Milliarden Dollar wert ist, von eigener kreativer Arbeit abhängt von anderen Leuten.
Wir wissen beispielsweise bereits, dass Bibliotheken mit Raubkopien zum Trainieren der generativen KI-Produkte von Unternehmen wie
Was wäre, wenn wir ChatGPT nach den gleichen Standards wie Claudine Gay durchführen würden?
Wenn Sie die Augen zusammenkneifen und den Kopf neigen, können Sie einige Ähnlichkeiten in den verschwommenen Formen von Harvard und OpenAI erkennen. Jede davon ist eine führende Institution für die Bildung von Köpfen, egal ob real oder künstlich – Harvard bildet intelligente Menschen aus, während OpenAI intelligente Maschinen entwickelt – und jede war in den letzten Tagen gezwungen, eine gemeinsame Behauptung zurückzuweisen. Nämlich, dass sie von intellektuellen Dieben vertreten werden.
Im vergangenen Monat warfen der konservative Aktivist Christopher Rufo und
Die unmögliche KI-Aufgabe des Weißen Hauses
Heute früh unterzeichnete Präsident Joe Biden die bislang umfassendsten Regulierungsgrundsätze für künstliche Intelligenz in Amerika: eine langwierige Durchführungsverordnung, die alle Arten von Regierungsbehörden anweist, sicherzustellen, dass Amerika bei der Entwicklung der Technologie führend ist und gleichzeitig die vielen Menschen anspricht Gefahren, die es mit sich bringt. Die Anordnung drängt die Behörden ausdrücklich dazu, Regeln und Richtlinien festzulegen, Berichte zu verfassen und Finanzierungs- und Forschungsinitiativen für KI zu schaffen – „die folgenreichste Technologie unserer Zeit“, wie der Präsident es ausdrückte.
Der
Künstler verlieren den Krieg gegen KI
Ende letzten Monats veröffentlichte OpenAI nach mehr als einem Jahr Wartezeit stillschweigend die neueste Version seines bildgenerierenden KI-Programms DALL-E 3. Die Ankündigung war voller beeindruckender Demos – darunter ein einminütiges Video, das demonstrierte, wie die Technologie Erstellen und vermarkten Sie mit nur wenigen Chat-Eingaben eine Figur für eine Kindergeschichte. Aber die vielleicht weitreichendste und folgenreichste Aktualisierung erfolgte in zwei am Ende eingefügten Sätzen: „DALL-E 3 ist darauf ausgelegt, Anfragen abzulehnen, die ein Bild im Stil eines lebenden Künstlers verlangen.“ Ersteller
Meine Bücher wurden verwendet, um Metas generative KI zu trainieren. Gut.
Wann Der Atlantik Im vergangenen Monat wurde bekannt, dass Zehntausende Bücher, die in den letzten 20 Jahren veröffentlicht wurden, ohne Erlaubnis zum Trainieren des KI-Sprachmodells von Meta verwendet wurden, so bekannte Autoren empörtnannte es einen „rauchenden Beweis“ für Fehlverhalten von Megakonzernen. Nachdem das Magazin nun eine durchsuchbare Datenbank mit betroffenen Büchern veröffentlicht hat, ist die Empörung noch größer: „Ich hätte niemals zugestimmt, dass Meta KI für eines meiner Bücher trainiert, geschweige denn für fünf davon“, schrieb die Schriftstellerin Lauren
Erotik, Atwood und „Für Dummies“: Die Bücher hinter Metas generativer KI
Anmerkung des Herausgebers: Dieser Artikel ist Teil von Der Atlantik‘s Serie über Books3. Hier können Sie selbst in der Datenbank recherchieren und sich über deren Entstehung informieren Hier.
Diesen Sommer habe ich über einen Datensatz von mehr als 191.000 Büchern berichtet, die von Meta, Bloomberg und anderen ohne Erlaubnis zum Trainieren generativer KI-Systeme verwendet wurden. „Books3“, wie es genannt wird, basierte auf einer Sammlung raubkopierter E-Books, die Reiseführer, selbstveröffentlichte erotische Belletristik, Romane von Stephen King und Margaret Atwood
Die Chatbots könnten sich selbst vergiften
Am Anfang ernährten sich die Chatbots und ihresgleichen vom von Menschen geschaffenen Internet. Verschiedene generative KI-Modelle, wie sie ChatGPT antreiben, begannen damit, Daten von Websites wie Wikipedia, Getty und Scribd zu verschlingen. Sie konsumierten Texte, Bilder und andere Inhalte und lernten durch algorithmische Verdauung deren Geschmack und Textur, welche Zutaten gut zusammenpassen und welche nicht, um ihre eigene Kunst und Schrift zu erschaffen. Aber dieses Fest machte ihnen nur Appetit.
Generative KI ist völlig auf die Nahrung angewiesen, die sie
Trainingsdaten auf Ihrer Apple Watch verloren? So protokollieren Sie Ihre Trainingseinheiten manuell
Ist Ihrer Apple Watch während des Trainings der Saft ausgegangen, sodass Sie keine Aufzeichnung aller verbrannten Kalorien hinterlassen haben? Mach dir keine Sorge; Sie können dies jedoch noch ausgleichen, indem Sie Ihre Trainingsdaten manuell zur Health-App hinzufügen. Werfen Sie einfach einen Blick auf Ihren bisherigen Trainingsverlauf, um eine Vorstellung davon zu bekommen, welche Informationen Sie einbeziehen sollten.
Wenn Sie beispielsweise eine Stunde lang gelaufen sind und Ihre Uhr mittendrin den Geist aufgegeben hat, können Sie Ihre vergangenen Läufe überprüfen, um