Eine KI, die Goat Simulator spielen kann, ist ein Schritt hin zu einer nützlicheren KI

Beim Training von KI-Systemen sind Spiele ein guter Ersatz für reale Aufgaben. „Ein allgemeiner Spielagent könnte im Prinzip viel mehr darüber lernen, wie man sich in unserer Welt zurechtfindet, als irgendetwas in einer einzelnen Umgebung jemals könnte“, sagt Michael Bernstein, außerordentlicher Professor für Informatik an der Stanford University, der nicht dabei war der Forschung.

„Man könnte sich vorstellen, dass wir eines Tages statt übermenschlicher Agenten, gegen die man spielt, Agenten wie SIMA haben könnten, die neben einem in Spielen mit euch und euren Freunden spielen“, sagt Tim Harley, ein Forschungsingenieur bei Google DeepMind, der Teil davon war Team, das den Wirkstoff entwickelt hat.

Das Team trainierte SIMA anhand zahlreicher Beispiele von Menschen, die Videospiele spielten, sowohl einzeln als auch kollaborativ, zusammen mit Tastatur- und Mauseingaben und Anmerkungen zu dem, was die Spieler im Spiel taten, sagt Frederic Besse, Forschungsingenieur bei Google DeepMind.

Dann nutzten sie eine KI-Technik namens Imitation Learning, um dem Agenten beizubringen, Spiele so zu spielen, wie es Menschen tun würden. SIMA kann 600 grundlegende Anweisungen befolgen, wie zum Beispiel „Links abbiegen“, „Die Leiter hinaufsteigen“ und „Karte öffnen“, die jeweils in weniger als etwa 10 Sekunden ausgeführt werden können.

Das Team stellte fest, dass ein SIMA-Agent, der in vielen Spielen geschult wurde, besser war als ein Agent, der nur ein einziges Spiel lernte. Dies liegt daran, dass es in der Lage war, Konzepte zu nutzen, die zwischen den Spielen geteilt wurden, um bessere Fertigkeiten zu erlernen und Anweisungen besser auszuführen, sagt Besse.

„Dies ist wiederum eine wirklich spannende Schlüsseleigenschaft, da wir einen Agenten haben, der Spiele spielen kann, die es im Grunde noch nie zuvor gegeben hat“, sagt er.

Diese Art des Wissenstransfers zwischen Spielen zu beobachten, sei ein bedeutender Meilenstein für die KI-Forschung, sagt Paulo Rauber, Dozent für künstliche Intelligenz an der Queen Mary University of London.

Die Grundidee, das Ausführen von Anweisungen anhand menschlicher Beispiele zu erlernen, könnte in Zukunft zu leistungsfähigeren Systemen führen, insbesondere bei größeren Datenmengen, sagt Rauber. Der relativ begrenzte Datensatz von SIMA bremst seine Leistung, sagt er.

source site

Leave a Reply