Gemini 1.5: Googles KI-Modell der nächsten Generation ist fast fertig

Knapp zwei Monate nach der Einführung von Gemini, dem großen Sprachmodell, das Google an die Spitze der KI-Branche bringen will, kündigt das Unternehmen bereits seinen Nachfolger an. Google bringt heute Gemini 1.5 auf den Markt und stellt es Entwicklern und Unternehmensanwendern zur Verfügung, bevor es bald vollständig für Verbraucher eingeführt wird. Das Unternehmen hat deutlich gemacht, dass Gemini als Geschäftstool, persönlicher Assistent und alles dazwischen voll im Einsatz ist, und treibt diesen Plan mit Nachdruck voran.

Es gibt viele Verbesserungen in Gemini 1.5: Gemini 1.5 Pro, das Allzweckmodell in Googles System, liegt offenbar auf Augenhöhe mit dem High-End-Modell Gemini Ultra, das das Unternehmen erst kürzlich auf den Markt gebracht hat, und übertrifft Gemini 1.0 Pro mit 87 Prozent von Benchmark-Tests. Es wurde mit einer zunehmend verbreiteten Technik erstellt, die als „Mixture of Experts“ oder MoE bekannt ist. Dies bedeutet, dass nur ein Teil des Gesamtmodells ausgeführt wird, wenn Sie eine Abfrage senden, anstatt das Ganze ständig zu verarbeiten. (Hier finden Sie eine gute Erklärung zu diesem Thema.) Durch diesen Ansatz sollte das Modell sowohl für Sie schneller zu verwenden als auch für die Ausführung durch Google effizienter sein.

Aber es gibt eine Neuerung in Gemini 1.5, die das gesamte Unternehmen, angefangen bei CEO Sundar Pichai, besonders begeistert: Gemini 1.5 verfügt über ein riesiges Kontextfenster, was bedeutet, dass es viel größere Abfragen bearbeiten und viel mehr Informationen auf einmal betrachten kann. Dieses Fenster beträgt satte 1 Million Token, verglichen mit 128.000 für OpenAIs GPT-4 und 32.000 für das aktuelle Gemini Pro. Token sind eine schwer zu verstehende Metrik (hier ist eine gute Aufschlüsselung), daher macht es Pichai einfacher: „Es handelt sich um etwa 10 oder 11 Stunden Video, Zehntausende Zeilen Code.“ Über das Kontextfenster können Sie den KI-Bot zu allen Inhalten auf einmal befragen.

(Pichai sagt auch, dass Googles Forscher ein 10-Millionen-Token-Kontextfenster testen – das ist sozusagen die ganze Reihe von Game of Thrones alles auf einmal.)

Während er mir das erklärt, bemerkt Pichai beiläufig, dass man das Ganze unterbringen kann Herr der Ringe Trilogie in dieses Kontextfenster. Das scheint zu spezifisch zu sein, also frage ich ihn: Das ist schon passiert, nicht wahr? Jemand bei Google prüft gerade, ob Gemini Kontinuitätsfehler entdeckt, versucht die komplizierte Abstammungslinie von Mittelerde zu verstehen und herauszufinden, ob die KI Tom Bombadil vielleicht endlich verstehen kann. „Ich bin sicher, es ist passiert“, sagt Pichai lachend, „oder wird passieren – eines von beiden.“

Pichai glaubt auch, dass das größere Kontextfenster für Unternehmen äußerst nützlich sein wird. „Dies ermöglicht Anwendungsfälle, bei denen Sie im Moment der Abfrage viele persönliche Kontexte und Informationen hinzufügen können“, sagt er. „Stellen Sie sich vor, wir haben das Abfragefenster erheblich erweitert.“ Er stellt sich vor, dass Filmemacher ihren gesamten Film hochladen und Gemini fragen würden, was die Rezensenten sagen würden; Er sieht Unternehmen, die Gemini nutzen, um Unmengen an Finanzunterlagen durchzusehen. „Ich betrachte es als einen der größeren Durchbrüche, die wir erzielt haben“, sagt er.

Derzeit wird Gemini 1.5 nur für Geschäftsanwender und Entwickler über Googles Vertex AI und AI Studio verfügbar sein. Letztendlich wird es Gemini 1.0 ersetzen, und die Standardversion von Gemini Pro – die für alle unter gemini.google.com und in den Apps des Unternehmens verfügbar ist – wird 1.5 Pro mit einem Kontextfenster für 128.000 Token sein. Um auf die Million zu kommen, muss man extra bezahlen. Google testet außerdem die Sicherheits- und ethischen Grenzen des Modells, insbesondere im Hinblick auf das nun größere Kontextfenster.

Google befindet sich derzeit in einem halsbrecherischen Wettlauf um die Entwicklung des besten KI-Tools, während Unternehmen auf der ganzen Welt versuchen, ihre eigene KI-Strategie zu finden – und ob sie ihre Entwicklerverträge mit OpenAI, Google oder jemand anderem unterzeichnen sollen. Erst diese Woche kündigte OpenAI „Speicher“ für ChatGPT an und scheint sich auf einen Vorstoß in die Websuche vorzubereiten. Bisher scheint Gemini beeindruckend zu sein, insbesondere für diejenigen, die bereits im Google-Ökosystem vertreten sind, aber es gibt auf allen Seiten noch viel zu tun.

Irgendwann, sagt mir Pichai, werden all diese 1.0er und 1.5er und Pros und Ultras und Unternehmensschlachten für die Benutzer keine Rolle mehr spielen. „Die Leute werden die Erfahrungen einfach konsumieren“, sagt er. „Es ist, als würde man ein Smartphone nutzen, ohne immer auf den Prozessor darunter zu achten.“ Aber im Moment, sagt er, befinden wir uns immer noch in der Phase, in der jeder den Chip in seinem Telefon kennt, weil er wichtig ist. „Die zugrunde liegende Technologie verändert sich so schnell“, sagt er. „Die Leute kümmern sich.“

source site

Leave a Reply