Google bringt sein größtes und „leistungsfähigstes“ KI-Modell auf den Markt: Gemini

Sundar Pichai, CEO von Google, spricht im Gespräch mit Emily Chang während des APEC CEO Summit im Moscone West am 16. November 2023 in San Francisco, Kalifornien. Der APEC-Gipfel findet in San Francisco statt und dauert bis zum 17. November.

Justin Sullivan | Getty Images-Nachrichten | Getty Images

Google bringt am Mittwoch sein seiner Meinung nach größtes und leistungsfähigstes Modell für künstliche Intelligenz auf den Markt, da der Druck auf das Unternehmen zunimmt, Antworten darauf zu geben, wie es KI monetarisieren will.

Das große Sprachmodell Gemini wird eine Suite in drei verschiedenen Größen umfassen: Gemini Ultra, seine größte und leistungsfähigste Kategorie; Gemini Pro, das sich für ein breites Aufgabenspektrum skalieren lässt; und Gemini Nano, das für bestimmte Aufgaben und mobile Geräte verwendet wird.

Derzeit plant das Unternehmen, Gemini über Google Cloud an Kunden zu lizenzieren, damit diese es in ihren eigenen Anwendungen verwenden können. Ab dem 13. Dezember können Entwickler und Unternehmenskunden über die Gemini API in Google AI Studio oder Google Cloud Vertex AI auf Gemini Pro zugreifen. Auch Android-Entwickler können mit Gemini Nano bauen. Gemini wird auch verwendet, um Google-Produkte wie den Bard-Chatbot und Search Generative Experience zu betreiben, das versucht, Suchanfragen mit Text im Konversationsstil zu beantworten (SGE ist noch nicht allgemein verfügbar).

Gemini Ultra ist das erste Modell, das menschliche Experten im MMLU (Massive Multitask Language Understanding) übertrifft, das eine Kombination aus 57 Fächern wie Mathematik, Physik, Geschichte, Recht, Medizin und Ethik verwendet, um sowohl Weltwissen als auch Problemlösungsfähigkeiten zu testen. Das sagte das Unternehmen am Mittwoch in einem Blogbeitrag. Es kann angeblich Nuancen und Argumente in komplexen Themen verstehen.

Sundar Pichai, CEO von Alphabet Inc., während der Google I/O Developers Conference in Mountain View, Kalifornien, USA, am Mittwoch, 10. Mai 2023.

David Paul Morris | Bloomberg | Getty Images

„Gemini ist das Ergebnis groß angelegter gemeinsamer Bemühungen von Teams bei Google, einschließlich unserer Kollegen bei Google Research“, schrieb CEO Sundar Pichai am Mittwoch in einem Blogbeitrag. „Es wurde von Grund auf multimodal konzipiert, was bedeutet, dass es verschiedene Arten von Informationen, einschließlich Text, Code, Audio, Bild und Video, verallgemeinern und nahtlos verstehen, verarbeiten und kombinieren kann.“

Ab heute wird Googles Chatbot Bard Gemini Pro verwenden, um beim erweiterten Denken, Planen, Verstehen und anderen Funktionen zu helfen. Anfang nächsten Jahres werde es „Bard Advanced“ auf den Markt bringen, das Gemini Ultra nutzen werde, sagten Führungskräfte am Dienstag in einem Telefonat mit Reportern. Es handelt sich um das größte Update von Bard, seinem ChatGPT-ähnlichen Chatbot.

Das Update kommt acht Monate nach dem ersten Start von Bard durch den Suchriesen und ein Jahr nach dem Start von ChatGPT durch OpenAI auf GPT-3.5. Im März dieses Jahres startete das von Sam Altman geführte Startup GPT-4. Führungskräfte sagten am Dienstag, dass Gemini Pro GPT-3.5 übertroffen habe, wichen jedoch der Frage aus, wie es im Vergleich zu GPT-4 abschneide.

Auf die Frage, ob Google plant, für den Zugriff auf „Bard Advanced“ Gebühren zu erheben, sagte Googles General Manager für Bard, Sissie Hsiao, dass das Unternehmen sich auf die Schaffung eines guten Benutzererlebnisses konzentriere und noch keine Details zur Monetarisierung habe.

Auf die Frage auf einer Pressekonferenz, ob Gemini im Vergleich zu LLMs der aktuellen Generation über neuartige Fähigkeiten verfügt, antwortete Eli Collins, Vizepräsident für Produkte bei Google DeepMind: „Ich vermute, dass dies der Fall ist“, aber dass es immer noch daran arbeite, die neuartigen Fähigkeiten von Gemini Ultra zu verstehen.

Berichten zufolge hat Google die Einführung von Gemini verschoben, weil es noch nicht fertig war, was Erinnerungen an die holprige Einführung seiner KI-Tools durch das Unternehmen zu Beginn des Jahres wachruft.

Mehrere Reporter fragten nach der Verzögerung, worauf Collins antwortete, dass das Testen der fortschrittlicheren Modelle länger dauerte. Collins sagte, Gemini sei das am besten getestete KI-Modell, das das Unternehmen entwickelt habe, und es verfüge über „die umfassendsten Sicherheitsbewertungen“ aller Google-Modelle.

Collins sagte, dass Gemini Ultra, obwohl es das größte Modell sei, deutlich günstiger in der Wartung sei. „Es ist nicht nur leistungsfähiger, es ist auch effizienter“, sagte er. „Wir benötigen immer noch viel Rechenleistung, um Gemini zu trainieren, aber wir werden im Hinblick auf unsere Fähigkeit, diese Modelle zu trainieren, viel effizienter.“

Collins sagte, das Unternehmen werde am Mittwoch ein technisches Whitepaper mit weiteren Details des Modells veröffentlichen, sagte jedoch, dass es die Umfangszählung nicht veröffentlichen werde. Anfang des Jahres stellte CNBC fest, dass das große Sprachmodell PaLM 2 von Google, sein damals neuestes KI-Modell, fast fünfmal so viele Textdaten für das Training verwendete wie sein Vorgänger LLM.

Ebenfalls am Mittwoch stellte Google seine Tensor-Verarbeitungseinheit der nächsten Generation zum Trainieren von KI-Modellen vor. Der TPU v5p-Chip, den Salesforce und das Startup Lightricks inzwischen verwenden, bietet für den Preis eine bessere Leistung als der 2021 angekündigte TPU v4, sagte Google. Zur Leistung im Vergleich zum Marktführer Nvidia machte das Unternehmen allerdings keine Angaben.

Die Chip-Ankündigung erfolgt Wochen, nachdem die Cloud-Konkurrenten Amazon und Microsoft ihre kundenspezifische, auf Silizium ausgerichtete KI vorgestellt haben.

Während der Telefonkonferenz zu den Ergebnissen des dritten Quartals von Google im Oktober stellten Investoren den Führungskräften weitere Fragen dazu, wie KI in tatsächliche Gewinne umgewandelt werden kann.

Im August startete Google ein „frühes Experiment“ namens Search Generative Experience (SGE), mit dem Benutzer sehen können, wie ein generatives KI-Erlebnis bei der Verwendung der Suchmaschine aussehen würde – die Suche ist immer noch ein wichtiges Profitcenter für das Unternehmen. Das Ergebnis ist gesprächiger und spiegelt das Zeitalter der Chatbots wider. Es gilt jedoch immer noch als Experiment und muss noch der breiten Öffentlichkeit vorgestellt werden.

Investoren fragen seit Mai nach einem Zeitplan für SGE, als das Unternehmen das Experiment erstmals auf seiner jährlichen Entwicklerkonferenz Google I/O ankündigte. In der Gemini-Ankündigung vom Mittwoch wurde SGE kaum erwähnt, und die Führungskräfte äußerten sich vage zu den Plänen, das Unternehmen der Öffentlichkeit zugänglich zu machen, und sagten, dass Gemini „im nächsten Jahr“ in das Unternehmen integriert werden würde.

„Diese neue Ära der Modelle stellt eine der größten wissenschaftlichen und technischen Anstrengungen dar, die wir als Unternehmen unternommen haben“, sagte Pichai im Blogbeitrag vom Mittwoch. „Ich bin wirklich gespannt auf das, was vor uns liegt, und auf die Möglichkeiten, die Gemini den Menschen überall eröffnen wird.“

– Jordan Novet von CNBC hat zu diesem Bericht beigetragen.

Verpassen Sie nicht diese Geschichten von CNBC PRO:

source site

Leave a Reply