Was wäre, wenn die KI versuchen würde, John Sterling nachzubilden?

Als ich aufwuchs, hatte meine Familie nie Kabelfernsehen und schaute auch nicht viel fern, deshalb erlebte ich Baseball über das Radio am Bett. Jeden Abend während der regulären Saison folgte ich den Yankees stellvertretend durch den Kommentar des Ansagers John Sterling, der zusammen mit Michael Kay und später Suzyn Waldman, die selbst eine Vorreiterin in der Welt der Sportübertragungen war, das Play-by-Play lieferte.

Ich kann einige von Sterlings Anrufen noch aus dem Gedächtnis aufsagen: David Wells! David Wells hat ein perfektes Spiel hingelegt. Siebenundzwanzig. Siebenundzwanzig runter. Baseball-Unsterblichkeit für David Wells! Und die Yankees gewinnen … thuh-uh-uh Yankees gewinnen! Das einzige Mal, dass ich als Fan früh im Stadion ankam, war nicht, um irgendeinen Wegwerf-Wackelkopf eines Spielers zu bekommen, sondern um sicherzustellen, dass ich ein T-Shirt mit John und Suzyn bekam, auf dem John und Suzyns Signaturzeile standen: Das ist Baseball, Suzyn.

Diese Momente sind mir diese Woche im Gedächtnis geblieben, nachdem der 85-jährige Sterling nach 36 Jahren und 5.631 Spielen – darunter sieben Weltmeisterschaften – seinen Rücktritt bekannt gegeben hatte. Er wurde gestern im Yankee Stadium geehrt. Alle üblichen Auszeichnungen sind eingetroffen: Sterling ist „unnachahmlich“, „einzigartig“, „unersetzlich“. An diesen Klischees ist etwas Wahres dran. Mit seiner Kombination aus Ernsthaftigkeit und Lagerhaftigkeit wird er sowohl geliebt als auch beklagt personalisierte Homerun-Anrufe für jeden Yankee-Spieler – Sterling ist sicherlich anders als alle anderen Ansager im Spiel. Aber als Reporter, der über Technologie und ihre Auswirkungen auf unsere Kultur berichtet, fragte ich mich, ob die Behauptungen über die Einzigartigkeit und Unreproduzierbarkeit von Sterlings Stimme veraltet waren.

Im Januar produzierten Betrüger einen völlig überzeugenden Robocall, in dem Präsident Joe Biden die Demokraten von New Hampshire scheinbar dazu drängte, die Vorwahlen im Bundesstaat auszusetzen. Dank der Fortschritte in der KI-Technologie ist es trivial einfach geworden, die eigene Stimme oder die einer anderen Person digital zu klonen. Diese Entwicklungen werfen die Frage auf: Was macht eine Stimme einzigartig und ist sie für niemanden mehr wirklich unnachahmlich? Könnte ein simulierter Sterling, der jahrelang als Spieler trainiert wurde, seinen Kommentar nicht noch lange nach seinem Tod glaubhaft weiterführen? Könnte sein Abbild nicht leicht von einer unternehmungslustigen Unterhaltungsfirma lizenziert und wiederbelebt werden?

Die Antwort ist nein – und der Grund dafür ist, dass es bestimmte Dinge gibt, die künstliche Intelligenz, egal wie fortgeschritten sie auch sein mag, niemals ersetzen kann. Was einen Sportmoderator großartig macht, ist nicht nur der Rhythmus seines Kommentars, sondern auch seine Fähigkeit, das Erlebte zu vermitteln und den Zuhörer mitzureißen. Die besten Play-by-Play-Kommentatoren verwickeln uns in eine besorgniserregende Verschwörung: Gemeinsam halten wir an jedem Pitch, jedem Schwung und jedem Fehlschuss fest. Ein Ansager ist weniger wegen seiner Wendungen etwas Besonderes als vielmehr wegen der Fähigkeit, diesen Moment mit uns zu erleben und unsere Aufregung, Spannung, Überraschung und unseren Kummer zu teilen.

Per Definition kann ein Computer dies nicht leisten. Egal wie sehr ein Robo-Sterling nach Sterling klang, er würde uns nie davon überzeugen können, dass ihm das Spiel so am Herzen liegt wie Sterling, denn das würde er nicht tun. Einer KI gelingt es vielleicht, seine Campiness zu kopieren, aber sie könnte niemals das Gefühl reproduzieren, eine Erfahrung zu teilen. Grundsätzlich ist die automatisierte Nachahmung von Emotionen nicht berauschend; es ist entfremdend – ein seelenloses Simulakrum, dem die Essenz menschlicher Interaktion fehlt.

Diese Wahrheit gilt nicht nur für Sportankündigungen, sondern auch für andere Genres künstlicher Audiosignale. Die KI-Erzählung kann Ihnen diesen Artikel gekonnt vorlesen und die nützliche Funktion erfüllen, die Informationen in Ihre Ohren zu übermitteln, aber sie kann keine herzzerreißende Ballade über Verlust und Sehnsucht produzieren.

Nun ja, technisch gesehen ist das möglich. Der Musikgenerator Sumo hat kürzlich für Schlagzeilen gesorgt, weil er in der Lage ist, eindrucksvoll Songs in unzähligen Genres und Stilrichtungen hervorzubringen. Letzten Monat nutzte der Journalist Ross Anderson das Tool, um ein unterhaltsames Konzeptalbum zu erstellen, das Folgendes enthielt: Kokomelone-ähnliches Liedchen, das die Freuden der Kinderarbeit preist, und ein aufgemotztes Seemannslied über einen nie endenden Rückkampf zwischen Biden und Trump.

Ich selbst konnte Sumo dazu bringen, eine passable Volksklage über die verlorene jüdische Gemeinde von Wilna zu produzieren – eine historische Heimat jüdischer Gelehrsamkeit, Kultur und politischer Gärung, die durch den Holocaust zerstört wurde. „Auf den Kopfsteinpflasterstraßen erfüllten Melodien die Luft / Aus dem jiddischen Theater wurden die Seelen bloßgelegt“, singt der virtuelle Sänger. „Aber die Dunkelheit nahte, ein Sturm begann sich zusammenzubrauen / Die pulsierende Stadt Wilna konnte ihr Schicksal nicht ungeschehen machen.“

Aber das Lied ist im Grunde ein Misserfolg, und zwar aus demselben Grund wie ein Pseudo-Sterling: Der Hörer glaubt nicht wirklich, dass der Sprecher sich für das Thema interessiert. So wie die KI nicht wirklich in das Baseballspiel oder die Yankees investiert ist, trauert sie nicht wirklich um den Verlust jüdischen Lebens in Wilna oder fragt sich, wie die Stadt vor der Zerstörung gewesen wäre. Je mehr wir von unserer Musik verlangen, desto weniger kann die KI liefern. Deshalb eignen sich diese Generatoren am besten für die Produktion von Kaugummi-Popsongs oder eingängigen Tanzhymnen und nicht für existenziell komplexere Dinge. Es fällt uns schwer, uns in etwas hineinzuversetzen, von dem wir erkennen, dass es ohne Empathie entsteht.

John Sterling bedeutet den Yankees-Fans etwas Besonderes. Aber er hat mir auch etwas beigebracht, das über Baseball hinausgeht: dass bestimmte Aspekte der menschlichen Erfahrung niemals wiederholt oder ersetzt werden können. Was uns zu dem macht, was wir sind, sind nicht nur die Geschichten, die wir erzählen, sondern die Geschichten, die wir teilen und gemeinsam leben.


source site

Leave a Reply