Google baut im Stillen eine allgegenwärtige KI auf, die mit all Ihren Geräten und Apps verknüpft wird – und „alles über Ihr Leben weiß“.

Vertrauliche Dokumente, die kürzlich auf einem internen Google-Gipfel vorgestellt wurden, beschreiben detailliert den Plan des Technologieriesen, eine künstliche Intelligenz (KI) zu schaffen, die zum „Lebensgeschichten-Erzähler“ seiner Nutzer werden soll.

Dafür benötigt die KI jedoch einen beispiellosen Zugriff auf die persönlichen Daten jedes Benutzers.

Es ist unklar, wo diese experimentelle KI, die derzeit als „Projekt Ellmann“ bezeichnet wird, unter den Apps und Diensten von Google angesiedelt sein wird, aber das Team dahinter arbeitet für Google Fotos – und ihre Präsentation schlug einen maßgeschneiderten KI-Chatbot vor.

„Wir können keine schwierigen Fragen beantworten oder gute Geschichten erzählen, ohne Ihr Leben aus der Vogelperspektive zu betrachten“, heißt es in einem Teil der Präsentation, die von einem Google-Produktmanager erstellt wurde.

Vertrauliche Dokumente, die kürzlich auf einem internen Google-Gipfel vorgestellt wurden, beschreiben detailliert den Plan des Technologieriesen, eine KI zu entwickeln, die zum „Erzähler von Lebensgeschichten“ für ihre Nutzer werden soll. Aufbauend auf dem ChatGPT-Konkurrenten Gemini des Unternehmens wird das neue Projekt Unmengen persönlicher Daten eines Benutzers abkratzen

Aufbauend auf dem ChatGPT-Konkurrenten Gemini des Unternehmens wird Project Ellmann „große Sprachmodelle“ (LLMs) verwenden, um persönliche Informationen aus dem Kontext zu synthetisieren, der angeblich Biografien von Benutzern und ihren Lieben sowie gespeicherte Foto-„Momente“ umfasst.

Aber die neuen Entwicklungen könnten Alarm bei denjenigen auslösen, die über Googles geheime Sammlung von Millionen sensibler Krankenakten von Einzelpersonen empört sind, die 2019 den Codenamen „Project Nightingale“ erhielt – oder bei allen, die eifrig Tipps zum digitalen Datenschutz sammeln.

„Wir durchsuchen Ihre Fotos und schauen uns ihre Tags und Standorte an, um einen bedeutungsvollen Moment zu identifizieren“, heißt es auf einer anderen Präsentationsfolie, die CNBC erhalten hat.

„Wenn wir einen Schritt zurücktreten und Ihr Leben in seiner Gesamtheit verstehen“, fuhr die Folie fort, „wird Ihre übergreifende Geschichte klar.“

Kurz gesagt, das Projekt hofft, einen personalisierten Chatbot im ChatGPT-Stil zu erstellen, der auf Ihre Interessen und Ihren Lebensverlauf zugeschnitten ist – basierend auf Ihrem Internet-Suchverlauf, der Kameraaufzeichnung Ihres Telefons und anderen Daten, einschließlich Google Wallet-Käufen und mehr.

Laut der Präsentation dieses Projektmanagers verbrachte ein Google Fotos-Team Monate damit, die Fähigkeit der LLMs zur Erkennung von Mustern zu bestätigen – nachdem es Suchergebnisse, Benutzerfotos und andere Daten aufgenommen hatte, um „bisher unmögliche Fragen“ über das Leben einer Person zu beantworten.

Der Anspruch des Teams, innige und ausführliche Porträts seiner Benutzer zu erstellen, ist im Namen des Projekts verankert: eine Anspielung auf den Literaturkritiker und Biographen Richard Ellmann, der für seine Biografie des Schriftstellers James Joyce einen National Book Award gewann.

Laut einer Folie hofft das Google-Team, dass „Ellmann“ irgendwann in der Lage sein wird, die persönlichen Fotos eines Nutzers detaillierter zu beschreiben als „nur Pixel mit Beschriftungen und Metadaten“.

In einem Beispiel diskutierten sie, wie das Ellmann LLM die Fotos eines Benutzers scannen und sie beispielsweise in „Erinnerungen“ oder „Momente“ von der Geburt des Kindes dieses Benutzers oder in eine Reihe von Bildern, die bei ihrem Klassentreffen in der High School aufgenommen wurden, zusammenfassen könnte .

„Es ist genau 10 Jahre her, dass er seinen Abschluss gemacht hat“, erklärt die Präsentationsfolie in einer Fotoanalyse, „und er ist voller Gesichter, die man seit 10 Jahren nicht mehr gesehen hat, also handelt es sich wahrscheinlich um ein Wiedersehen.“

Als Beispiel für die Art von „bisher unmöglichen Fragen“, bei deren Beantwortung Project Ellmann den Benutzern helfen konnte, bot die Präsentation hypothetische Benutzeranfragen, um zu erfahren, wann ihre Geschwister sie das letzte Mal besucht hatten oder in welche Stadt sie ziehen sollten.

Ellmann konnte anhand der Präsentation beides beantworten.

Ellmann schien auch in der Lage zu sein, Käufe vorherzusagen und zu empfehlen und präsentierte sogar eine Zusammenfassung der Essgewohnheiten des Benutzers.

„Sie scheinen italienisches Essen zu mögen“, bemerkte das Project Ellmann LLM auf einer Folie. „Es gibt mehrere Fotos von Nudelgerichten, außerdem ein Foto einer Pizza.“

Angesichts der Tatsache, dass die Präsentation von einem Manager von Google Fotos kam, spekulierte CNBC, dass das Unternehmen möglicherweise plant, das neue KI-Produkt in seiner Google Fotos-App unterzubringen.

Laut einem Google Cloud-Blogbeitrag hat Google Fotos über eine Milliarde Nutzer und speichert 4 Billionen Fotos und Videos.

Als direkteres Zeichen dafür, wen das Google-Team als seine Konkurrenz ansah, fasste das Team „Ellmann Chat“ für seine Kollegen zusammen, indem es sie aufforderte: „Stellen Sie sich vor, ChatGPT zu öffnen, aber es weiß bereits alles über Ihr Leben.“

In einem Beispiel bietet Gemini eine Schritt-für-Schritt-Anleitung zum Kochen eines Omeletts, indem Bilder des Benutzers an verschiedenen Stellen analysiert werden

In einem Beispiel bietet Gemini eine Schritt-für-Schritt-Anleitung zum Kochen eines Omeletts, indem Bilder des Benutzers an verschiedenen Stellen analysiert werden

Google befürchtete das Schlimmste, als der Konkurrent OpenAI vor einem Jahr seinen Chatbot für künstliche Intelligenz (KI), ChatGPT, auf den Markt brachte.

Gemini, die Antwort auf den KI-Chatbot, der für Googles Chatbot Bard entwickelt wurde, übertrifft den GPT-4 von ChatGPT in den meisten kognitiven Tests, so Google.

Zwillinge können Benutzern sagen, wann ein Omelett gekocht ist, das beste Design für ein Papierflugzeug vorschlagen oder einem Fußballspieler helfen, seine Fähigkeiten zu verbessern, wie aus einer neueren und öffentlich zugänglichen Forschungsarbeit hervorgeht.

Vor allem aber ist es in Mathematik und Physik begabt, was die Hoffnung nährt, dass es zu wissenschaftlichen Durchbrüchen führen könnte, die das Leben der Menschen verbessern.

Google behauptet, dass Gemini GPT-4 in 30 von 32 Leistungsmaßstäben übertrifft – darunter Textgenerierung, Beantwortung von Fragen, Argumentation, Bildverständnis und „logisches Denken“.

In seinem Gemini-Forschungspapier skizzierte Google verschiedene Fähigkeiten der KI, wenn es um Bilder geht, einschließlich der Frage, was aus verschiedenfarbigen Fäden gestrickt werden soll.

Während Gemini vorerst nur auf Englisch funktionieren wird, sagte das Unternehmen, dass die Technologie problemlos auf andere Sprachen übertragen werden kann.

Zusätzlich zu Project Ellmann und Bard plant Google, Gemini auch in seiner Flaggschiff-Suchmaschine einzusetzen.

Das Unternehmen schien von der durchgesickerten Präsentation gegenüber CNBC völlig überrascht zu sein und gab über einen Sprecher Klarstellungen zu Datenschutzfragen heraus.

„Google Fotos nutzt seit jeher KI, um Menschen bei der Suche nach ihren Fotos und Videos zu helfen“, sagte der Sprecher, „und wir freuen uns über das Potenzial von LLMs, noch hilfreichere Erlebnisse zu ermöglichen.“

„Dies war eine frühe interne Untersuchung“, betonte der Sprecher.

„Sollten wir uns entscheiden, neue Funktionen einzuführen, würden wir uns die nötige Zeit nehmen, um sicherzustellen, dass sie für die Menschen hilfreich sind und der Schutz der Privatsphäre und Sicherheit der Benutzer oberste Priorität hat.“

source site

Leave a Reply