OpenAIs Operator: Ihr autonomer KI-Assistent für die Ausführung von Online-Befehlen

- Advertisement -

OpenAI hat Operator eingeführt, einen KI-Agenten, der Textaufforderungen in Online-Aufgaben umsetzt. Aktuell in der Forschungs-Vorschau für ChatGPT Pro-Abonnenten verfügbar, kann Operator Buchungen und Käufe durchführen, jedoch variieren die Ergebnisse. Der Agent nutzt das CUA-Modell von OpenAI und kann ohne spezielle API-Integrationen agieren. Trotz seiner Fähigkeiten zeigt Operator in der Praxis Schwächen, wie Halluzinationen und langsame Bearbeitungsgeschwindigkeiten. Die Zukunft und Zuverlässigkeit dieses Tools bleibt ungewiss.

Einführung von OpenAI’s Operator: Ihr neuer KI-Assistent

OpenAI hat Operator ins Leben gerufen, einen weitgehend autonomen KI-Agenten, der darauf ausgelegt ist, Ihre Textaufforderungen in praktische Aufgaben umzusetzen, die im Internet erledigt werden können. In der Theorie können Sie ihn nahezu alles tun lassen, was über einen Webbrowser machbar ist. In der Praxis berichten jedoch erste Nutzer von einer gemischten Erfahrung mit den Ergebnissen.

Funktionen und Möglichkeiten von Operator

Operator kann Aufgaben wie Reisebuchungen, Restaurantreservierungen zu bestimmten Zeiten oder den Kauf von Konzertkarten für eine bestimmte Band innerhalb eines festgelegten Preisrahmens übernehmen.

Aktuell wird Operator als Forschungs-Vorschau veröffentlicht, die exklusiv für ChatGPT Pro-Abonnenten zugänglich ist. Es handelt sich dabei noch nicht um ein vollständig ausgereiftes Produkt. Der KI-Agent basiert auf OpenAIs Computer-Using Agent (CUA)-Modell, das die Computer Vision-Fähigkeiten von GPT-4o mit spezifischem Training für grafische Benutzeroberflächen (GUIs) kombiniert. Dies ermöglicht es Operator, im Internet zu surfen, komplexe Aufgaben aus einer Textaufforderung zu entwickeln und sie auszuführen.

Obwohl Operator nicht der einzige seiner Art ist – ähnliche Aufgaben übernehmen auch ByteDance’s UI-TARS und Anthropic’s Computer Use – hebt sich Operator durch die Fähigkeit hervor, ohne benutzerdefinierte API-Integrationen zu arbeiten.

„Operator kann ‘sehen’ (durch Screenshots) und ‘interagieren’ (über alle Funktionen, die Maus und Tastatur ermöglichen) mit einem Browser“, erklärt OpenAI. Dies erlaubt es ihm, im Internet zu agieren, ohne auf spezielle API-Anpassungen angewiesen zu sein.

Es wird jedoch empfohlen, dass Webdienste für die beste Leistung von Operator optimiert sind. OpenAI arbeitet mit Unternehmen wie DoorDash, Instacart, OpenTable und anderen zusammen, um sicherzustellen, dass die Bedürfnisse der Nutzer erfüllt werden, während gleichzeitig die etablierten Standards beachtet werden.

Die Leistung von Operator bei nicht optimierten Diensten könnte jedoch weniger präzise sein.

Wie gut Operator momentan bei der Umsetzung von Textaufforderungen ist, bleibt unklar. OpenAI gibt an, dass die CUA-Modelle eine Erfolgsquote von 38,1 % beim OSWorld-Benchmark-Test für vollständige Computerbenutzungsaufgaben erzielen, 58,1 % für WebArena und 87 % bei WebVoyager für webbasierte Aufgaben.

Einige frühe Nutzer berichten zudem, dass Operator anfälliger für Halluzinationen ist als die neuesten Versionen von ChatGPT. Ein Nutzer berichtet, dass Operator bei der Erstellung einer Liste von Online-Influencern sämtliche Details erfunden hat.

Darüber hinaus klagen einige Nutzer über die Geschwindigkeit von Operator, was mit der von OpenAI veröffentlichten Video-Demo übereinstimmt. Die Eingaben erfolgen alles andere als rasch.

Es ist also riskant, darauf zu vertrauen, dass Operator nächste Woche Ihre Einkäufe verlässlich erledigt oder überhaupt Ergebnisse liefert.

Die entscheidende Frage bleibt, wie schnell sich diese frühe Beta-Version von Operator zu einem zuverlässigen und nützlichen Tool entwickeln wird. Und wie sicher es letztendlich sein wird, wenn diese Entwicklung eintritt.

„Wir wissen, dass böswillige Akteure versuchen könnten, diese Technologie missbräuchlich zu nutzen. Daher haben wir Operator so konzipiert, dass er schädliche Anfragen ablehnt und unerlaubte Inhalte blockiert“, teilt OpenAI mit und ergänzt, dass Operator auch mit Websites umgehen kann, die versuchen könnten, den KI-Agenten mit versteckten Aufforderungen oder Phishing-Versuchen zu überlisten.

In der Zwischenzeit bleibt die Zukunft von Operator ungewiss. Doch es scheint, dass Sie bald in der Lage sein werden, einige Ihrer alltäglichen Online-Aufgaben einem KI-Agenten anzuvertrauen.

- Advertisement -

Related Articles