Die spielerische KI von DeepMind hat gerade einen 50 Jahre alten Rekord in der Informatik gebrochen

„Das ist ein wirklich erstaunliches Ergebnis“, sagt François Le Gall, Mathematiker an der Universität Nagoya in Japan, der nicht an der Arbeit beteiligt war. „Matrixmultiplikation wird überall in der Technik verwendet“, sagt er. „Alles, was Sie numerisch lösen möchten, verwenden Sie normalerweise Matrizen.“

Trotz der Allgegenwärtigkeit der Berechnung ist sie immer noch nicht gut verstanden. Eine Matrix ist einfach ein Zahlenraster, das alles darstellt, was Sie wollen. Das Multiplizieren zweier Matrizen beinhaltet typischerweise das Multiplizieren der Zeilen der einen mit den Spalten der anderen. Die grundlegende Technik zur Lösung des Problems wird in der High School gelehrt. „Es ist wie das ABC der Informatik“, sagt Pushmeet Kohli, Leiter des AI for Science-Teams von DeepMind.

Aber die Dinge werden kompliziert, wenn Sie versuchen, eine schnellere Methode zu finden. „Niemand kennt den besten Algorithmus zur Lösung“, sagt Le Gall. „Das ist eines der größten offenen Probleme der Informatik.“

Dies liegt daran, dass es mehr Möglichkeiten gibt, zwei Matrizen miteinander zu multiplizieren, als es Atome im Universum gibt (10 hoch 33 für einige der Fälle, die die Forscher untersuchten). „Die Anzahl möglicher Aktionen ist nahezu unendlich“, sagt Thomas Hubert, Ingenieur bei DeepMind.

Der Trick bestand darin, das Problem in eine Art dreidimensionales Brettspiel namens TensorGame zu verwandeln. Das Brett stellt das zu lösende Multiplikationsproblem dar, und jeder Zug stellt den nächsten Schritt zur Lösung dieses Problems dar. Die Reihe von Zügen, die in einem Spiel gemacht werden, repräsentiert daher einen Algorithmus.

Die Forscher trainierten eine neue Version von AlphaZero namens AlphaTensor, um dieses Spiel zu spielen. Anstatt die besten Zugfolgen für Go oder Schach zu lernen, lernte AlphaTensor die besten Schrittfolgen für die Multiplikation von Matrizen. Es wurde belohnt, die Partie mit möglichst wenigen Zügen zu gewinnen.

„Wir haben dies in ein Spiel verwandelt, unsere bevorzugte Art von Framework“, sagt Hubert, einer der leitenden Forscher bei AlphaZero.

source site

Leave a Reply