Die KI-Branche ist auf eine ganz bestimmte Art der Nutzung eines Chatbots angewiesen

Ein perfekter Tag in Los Angeles beginnt mit einem Spaziergang entlang der Strandpromenade von Venice Beach. Anschließend eine Fahrt mit dem Riesenrad im benachbarten Santa Monica. Dann besuchen Sie das Getty Museum, etwa 15 Kilometer mit dem Auto entfernt. Danach Beverly Hills, dann Hollywood, um den Walk of Fame zu sehen, dann Griffith Park für eine Wanderung, dann Chinatown für Dim Sum, dann in die Innenstadt, vielleicht um eine Abendshow in der Walt Disney Concert Hall zu sehen.

Zumindest ist es das, was ein Chatbot unter einem „perfekten Tag“ versteht. Diese Agenda wurde von Microsoft Copilot speziell für mich erstellt, nachdem ich ihm gesagt hatte, dass ich einen Tag in der Stadt habe, um die Sehenswürdigkeiten zu erkunden, und ihn gebeten hatte, entsprechend zu planen. “Sicherlich! 🌴🌆 Hier ist ein vollgepackter 24-Stunden-Reiseplan“, antwortete Copilot, bevor er eine achtteilige Antwort herunterrasselte. Was ich Copilot nicht gesagt habe, ist, dass ich bereits hier lebe – und weiß, dass eine solche Reiseroute nur dann perfekt ist, wenn Ihre Vorstellung von Glück darin besteht, den größten Teil des Tages damit zu verbringen, eine der weitläufigsten, verkehrsreichsten Städte des Landes zu durchqueren und hektisch davonzufahren Wahrzeichen zu Wahrzeichen.

Ich habe Copilot gebeten, mir einen Reiseplan zu erstellen, weil Microsoft ihn als Beispiel dafür angeführt hat, wie Menschen den ChatGPT-ähnlichen Assistenten nutzen können. Es kann Ihnen angeblich dabei helfen, ein Ziel auszuwählen, Flugpreise zu vergleichen und sich für Attraktionen zu entscheiden, die „bei Touristen beliebt sind – oder einfach etwas abseits der ausgetretenen Pfade liegen“. Von all den Dingen, die Sie einen Chatbot fragen könnten, schlagen KI-Unternehmen Ihnen gerne vor, Sie um Hilfe bei der Planung bevorstehender Reisen zu bitten. Öffnen Sie ChatGPT und Sie sehen möglicherweise diese hypothetische Aufforderung: „Planen Sie eine Reise, um in drei Tagen das Beste von New York zu sehen.“ Ähnliches bietet der Gemini-Chatbot von Google. Zu den Chatbot-Assistenten von Meta auf Instagram und Facebook gehört „Lorena“, Ihre persönliche Reiseexpertin. Und Rabbit, das Unternehmen hinter einem neuen KI-Gadget, hat letzten Monat das Reisebeispiel für ein Keynote-Video herausgeholt.

Wenn man KI-Marketing-Bingo spielen würde, würde „Reiseroute“ praktisch jedes Mal durchgestrichen. Mehr als ein Jahr nach Beginn der generativen KI-Revolution schlagen Unternehmen den Menschen so häufig vor, ihre Tools auf diese Weise zu nutzen, dass man meinen könnte, Chatbots würden darin hervorragende Leistungen erbringen. Aber das tun sie nicht.

Theoretisch sind Chatbots, die sofort Reisepläne erstellen können, der Traum eines jeden Vermarkters. Der Anwendungsfall ist leicht zu verstehen: Die Planung eines Urlaubs kann für Menschen eine echte Herausforderung sein. Erstens geht es darum, zwischen Fluglisten, Hotelverfügbarkeit und Ticket-Websites für die wichtigsten Attraktionen zu wechseln. Dann bedarf es einer differenzierteren Recherche, um herauszufinden, welche lokalen Restaurants tatsächlich gut und welche überteuerte Touristenbetrüger sind, oder um herauszufinden, wann man zu einer großen Wanderung aufbrechen sollte, bei der man nach Sonnenuntergang nicht im Wald zurückbleibt.

Die meisten dieser Reiseinformationen sind bereits im Internet oder in Büchern verfügbar, was bedeutet, dass sie wahrscheinlich bereits in die Trainingsdaten eines Chatbots integriert wurden. „Es gibt wahrscheinlich Tausende von Stellen auf Webseiten, die eine Reise nach Boston beschreiben“, sagte mir Kathleen Creel, Professorin für Philosophie und Informatik an der Northeastern University. „Es gibt Reiseseiten. Es gibt Reiseveranstalter. Auf Reddit sprechen Leute über ihre Reise nach Boston. Auf Reddit sprechen Leute über das Leben in Boston und was ihnen gefällt.“ Ein auf all diese Daten trainiertes KI-Tool kann sie verarbeiten, um eine personalisierte Reiseroute auszuspucken.

Doch in der Praxis lassen KI-Reisepläne zu wünschen übrig. Als ich ChatGPT sagte, dass ich ein „großer Feinschmecker“ sei und es darum bat, die Reiseroute in LA entsprechend anzupassen, schlug es mir vor, zum Abendessen in ein mit einem Michelin-Stern ausgezeichnetes Restaurant zu gehen. Es wurde nicht gesagt, welches. Mir wurde nur gesagt, dass es in L.A. welche gibt und dass ich dorthin gehen sollte, wenn ich Essen mag. Das ist so, als würde man einer Person, die Musik mag, sagen, dass sie vielleicht auf einen Grammy-prämierten Künstler stehen würde, und es dabei belassen. ChatGPT schlug mir vor, meinen Tag mit einem „süßen Leckerbissen“ in der Milk Bar ausklingen zu lassen, einer Kette hochwertiger Bäckereien der New Yorker Konditorin Christina Tosi.

Vielleicht bin ich nur wählerisch, aber ein Forscherteam der Fudan-Universität in Shanghai, der Ohio State University, der Penn State und Meta kam zu einem ähnlichen Schluss. Sie testeten Chatbots anhand von 1.000 Beispielanfragen, wie zum Beispiel „Bitte erstellen Sie einen Reiseplan für einen Alleinreisenden, der von Jacksonville abfliegt und für einen Zeitraum von drei Tagen, vom 25. bis 27. März 2022, nach Los Angeles reist.“ Das Budget für diese Reise beträgt jetzt auf 2.400 $ festgelegt.“ Anschließend bewerteten sie, ob die Chatbots Antworten liefern konnten, die alle Kriterien der Eingabeaufforderung erfüllten. Die Chatbots haben auf ganzer Linie versagt. Von den vier getesteten Modellen schnitt das GPT-4-Modell von OpenAI am besten ab, aber selbst es beantwortete nur sechs von 1.000 Anfragen erfolgreich, also 0,6 Prozent. (Die Forschung wurde noch nicht von Experten begutachtet.)

Die Chatbots scheiterten aus verschiedenen Gründen: Sie machten Denkfehler und erfanden manchmal Dinge. „Ich kann das nicht genug betonen: Solche Tools sollen unseren Entscheidungsprozess ergänzen und nicht ersetzen“, sagte mir Brigitte Tousignant, Kommunikationsleiterin des KI-Unternehmens Hugging Face. Sie nutzte den Chatbot ihres Unternehmens, um eine einwöchige Reise nach Montreal zu planen, und war „angenehm überrascht“, wie konkret die Ergebnisse waren. Dann bemerkte sie, dass der Bot ihr vorschlug, drei Comedy- und Musikfestivals zu besuchen, die jeweils zu unterschiedlichen Zeiten im Jahr stattfinden.

Angesichts dieser Nachteile habe ich fünf KI-Unternehmen – Microsoft, Google, OpenAI, Meta und Rabbit – gefragt, warum sie die Verwendung dieser Tools für die Reiseplanung erwähnen. Nur Microsoft und Google haben zu dieser Geschichte einen Kommentar abgegeben. „Das erste Wertversprechen von KI bei der Reiseplanung besteht in der erheblichen Zeitersparnis und Informationsbeschaffung, die sie bietet“, sagte mir ein Microsoft-Sprecher in einer E-Mail-Erklärung. „Wir haben gesehen, dass Leute es mit großartigen Ergebnissen nutzen.“ Aarush Selvan, leitender Produktmanager für Gemini-Erlebnisse bei Google, erzählte mir, dass die Leute den Chatbot des Unternehmens bereits seit seiner Einführung genutzt hätten, um Reisen zu planen oder Reiseinspirationen zu erhalten.

Eines Tages könnte KI tatsächlich in der Lage sein, eine außergewöhnliche Reise für Sie zu planen – insbesondere, wenn diese Bots zu Agenten werden, die tatsächlich Maßnahmen ergreifen können, beispielsweise Flüge in Ihrem Namen buchen. Google ist noch nicht ganz so weit, hat aber Google Flights und Google Maps in seinen Gemini-Chatbot integriert, der Flugoptionen aufruft, wenn Sie nach einem Reiseplan fragen. „Wir wissen, dass wir hier wirklich nur an der Oberfläche kratzen“, sagte mir Selvan.

Bis dahin dient jeder Anstoß eines KI-Unternehmens, seine Tools zur Planung einer Reise zu nutzen, als Erinnerung an den Chatbot-Lochzustand, in dem wir uns befinden. Seit der Veröffentlichung von ChatGPT ist mehr als ein Jahr vergangen, und der anfängliche Hype hat nachgelassen. Diese Tools sind beeindruckend und haben eindeutig viel Potenzial. Aber genau dafür sind diese Tools am besten geeignet im Augenblick ist immer noch unklar. „Viele Dinge, die sich als wirklich nützliche Anwendungsfälle von KI herausstellen, sind nicht so sexy, verbraucherorientierte Dinge“, sagte Creel. „Dabei handelt es sich um Dinge wie maschinelles Lernen für die Wissenschaft oder die Tatsache, dass große Sprachmodelle diese überraschenden Anwendungen in der Arzneimittelforschung oder beim Proteindesign oder ähnlichem haben.“ Diese Anwendungen können unsere Gesundheitssysteme und unsere Welt verändern. Aber leider machen sie es nicht einfacher, am Strand Cocktails zu schlürfen.

source site

Leave a Reply