Mehrere Chat-GPT-Instanzen werden kombiniert, um die Chemie herauszufinden

Vergrößern / Das Labor ist leer, weil sich alle im Park entspannen, während die KI ihre Arbeit erledigt.

Trotz der rasanten Fortschritte in der künstlichen Intelligenz sind KIs noch lange nicht in der Lage, Menschen in der Wissenschaft zu ersetzen. Das heißt aber nicht, dass sie nicht dabei helfen können, einen Teil der Plackerei aus dem Alltagstrott wissenschaftlicher Experimente zu automatisieren. Vor ein paar Jahren haben Forscher beispielsweise eine KI zur Steuerung automatisierter Laborgeräte eingesetzt und ihr beigebracht, alle Reaktionen, die zwischen einer Reihe von Ausgangsmaterialien auftreten können, umfassend zu katalogisieren.

Dies war zwar nützlich, erforderte aber dennoch zahlreiche Eingriffe der Forscher, um das System überhaupt zu trainieren. Eine Gruppe an der Carnegie Mellon University hat nun herausgefunden, wie man ein KI-System dazu bringen kann, sich selbst die Chemie beizubringen. Das System erfordert einen Satz von drei KI-Instanzen, die jeweils auf unterschiedliche Vorgänge spezialisiert sind. Aber sobald es eingerichtet und mit Rohstoffen versorgt ist, müssen Sie ihm nur sagen, welche Art von Reaktion Sie durchführen möchten, und es wird es herausfinden.

Eine KI-Trinität

Die Forscher geben an, dass sie daran interessiert waren, zu verstehen, welche Kapazitäten große Sprachmodelle (LLMs) für das wissenschaftliche Unterfangen bieten können. Daher sind alle in dieser Arbeit verwendeten KI-Systeme LLMs, hauptsächlich GPT-3.5 und GPT-4, obwohl auch einige andere – Claude 1.3 und Falcon-40B-Instruct – getestet wurden. (GPT-4 und Claude 1.3 schnitten am besten ab.) Aber anstatt ein einziges System zur Handhabung aller Aspekte der Chemie zu verwenden, richteten die Forscher separate Instanzen ein, um in einem arbeitsteiligen System zusammenzuarbeiten, und nannten es „Coscientist“.

Die drei verwendeten Systeme sind:

Websucher. Dies hat zwei Hauptfunktionen. Eine besteht darin, die Such-API von Google zu verwenden, um Seiten zu finden, die aufgrund der darin enthaltenen Informationen einen Besuch wert sein könnten. Die zweite besteht darin, diese Seiten aufzunehmen und Informationen daraus zu extrahieren. Stellen Sie sich das ähnlich wie den Kontext der früheren Teile einer Konversation vor, den Chat GPT als Grundlage für spätere Antworten pflegen kann. Die Forscher konnten verfolgen, wo dieses Modul seine Zeit verbrachte, und etwa die Hälfte der Orte, die es besuchte, waren Wikipedia-Seiten. Zu den fünf am häufigsten besuchten Websites gehörten die Zeitschriften der American Chemical Society und der Royal Society of Chemistry.

Dokumentationssucher. Betrachten Sie dies als die RTFM-Instanz. Der KI sollte die Kontrolle über verschiedene Laborautomatisierungsgeräte wie Roboter-Flüssigkeitshandhaber und dergleichen übertragen werden, die oft entweder über spezielle Befehle oder so etwas wie eine Python-API gesteuert wurden. Dieser KI-Instanz wurde Zugriff auf alle Handbücher für dieses Gerät gewährt, sodass sie herausfinden konnte, wie sie es steuert.

Planer. Der Planer kann den beiden anderen KI-Instanzen Befehle erteilen und deren Antworten verarbeiten. Es hat Zugriff auf eine Python-Sandbox, um Code auszuführen und so Berechnungen durchzuführen. Es hat auch Zugriff auf die automatisierte Laborausrüstung und kann so Experimente tatsächlich durchführen und analysieren. Man kann sich den Planer also als den Teil des Systems vorstellen, der sich wie ein Chemiker verhalten muss, der aus der Literatur lernt und versucht, das Gelernte mithilfe von Geräten umzusetzen.

Der Planer kann auch feststellen, wann Softwarefehler auftreten (entweder in seinen Python-Skripten oder bei seinen Versuchen, die automatisierte Hardware zu steuern), und so seine Fehler korrigieren.

Das System zum Einsatz bringen

Ursprünglich sollte das System eine Reihe von Chemikalien wie Paracetamol und Ibuprofen synthetisieren, was bestätigte, dass es nach einer Suche im Internet und in der wissenschaftlichen Literatur im Allgemeinen eine brauchbare Synthese finden konnte. Die Frage ist also, ob das System die Hardware, auf die es Zugriff hatte, gut genug herausfinden konnte, um seine konzeptionellen Fähigkeiten in die Tat umzusetzen.

Um mit etwas Einfachem zu beginnen, verwendeten die Forscher eine Standard-Probenplatte, die eine Reihe kleiner Vertiefungen enthielt, die in einem rechteckigen Raster angeordnet waren. Das System sollte Quadrate, diagonale Streifen oder andere Muster mit verschiedenfarbigen Flüssigkeiten ausfüllen und schaffte dies effektiv.

Anschließend platzierten sie drei verschiedenfarbige Lösungen an zufälligen Stellen im Brunnengitter; Das System wurde gebeten, zu erkennen, welche Vertiefungen welche Farbe hatten. Coscientist allein wusste nicht, wie man das macht. Doch als es darauf hingewiesen wurde, dass die verschiedenen Farben unterschiedliche Absorptionsspektren aufweisen würden, nutzte es einen Spektrographen, zu dem es Zugang hatte, und konnte die verschiedenen Farben identifizieren.

Da die grundlegende Befehls- und Kontrollfunktion scheinbar funktionierte, beschlossen die Forscher, etwas Chemie auszuprobieren. Sie stellten eine Probenplatte mit Vertiefungen bereit, die mit einfachen Chemikalien, Katalysatoren und Ähnlichem gefüllt waren, und forderten sie auf, eine bestimmte chemische Reaktion durchzuführen. Coscientist hat die Chemie von Anfang an verstanden, aber seine Versuche, die Synthese durchzuführen, scheiterten, weil es einen ungültigen Befehl an die Hardware sendete, die die Reaktionen erhitzt und anregt. Dadurch wurde es an das Dokumentationsmodul zurückgesendet, sodass es das Problem beheben und Reaktionen ausführen konnte.

Und es hat funktioniert. Im Reaktionsgemisch waren spektrale Signaturen der gewünschten Produkte vorhanden und ihre Anwesenheit wurde durch Chromatographie bestätigt.

Optimierung

Wenn die Grundreaktionen funktionierten, forderten die Forscher das System dann auf, die Effizienz der Reaktion zu verbessern – sie stellten den Optimierungsprozess als ein Spiel dar, bei dem die Punktzahl mit der Ausbeute der Reaktion steigen würde.

Das System machte in der ersten Runde der Testreaktionen einige Fehleinschätzungen, konzentrierte sich aber schnell auf bessere Erträge. Die Forscher fanden außerdem heraus, dass sie die schlechten Entscheidungen in der ersten Runde vermeiden konnten, indem sie Coscientist Informationen über die Erträge lieferten, die durch eine Handvoll zufälliger Ausgangsmischungen erzielt wurden. Dies bedeutet, dass es keine Rolle spielt, woher der Coscientist seine Informationen bezieht – sei es aus den von ihm durchgeführten Reaktionen oder aus einer externen Informationsquelle –, dass er in der Lage ist, die Informationen in seine Planung einzubeziehen.

Die Forscher kommen zu dem Schluss, dass Coscientist über mehrere bemerkenswerte Fähigkeiten verfügt:

  • Planung einer chemischen Synthese anhand öffentlicher Informationen
  • Navigieren und Bearbeiten technischer Handbücher für komplizierte Hardware
  • Nutzen Sie dieses Wissen, um eine Reihe von Laborgeräten zu steuern
  • Integration dieser Hardware-Handhabungsfunktionen in einen Labor-Workflow
  • Analysieren Sie Ihre eigenen Reaktionen und nutzen Sie diese Informationen, um verbesserte Reaktionsbedingungen zu entwickeln.

In vielerlei Hinsicht klingt das nach der Erfahrung, die ein Student im ersten Jahr seines Graduiertenstudiums machen könnte. Im Idealfall wird der Doktorand darüber hinaus weiterkommen. Aber vielleicht wird GPT-5 das auch können.

Im Ernst: Die Struktur von Coscientist, die auf dem Zusammenspiel einer Reihe spezialisierter Systeme beruht, ähnelt der Funktionsweise des Gehirns. Offensichtlich sind die spezialisierten Systeme des Gehirns zu einem viel größeren Spektrum an Aktivitäten fähig, und es gibt noch viel mehr davon. Es kann jedoch sein, dass diese Art von Struktur entscheidend ist, um komplizierteres Verhalten zu ermöglichen.

Allerdings sind die Forscher selbst besorgt über einige der Fähigkeiten von Coscientist. Es gibt viele Chemikalien (denken Sie an Nervengase), deren Synthese wir nicht erleichtern möchten. Und herauszufinden, wie man GPT-Instanzen anweist, etwas nicht zu tun, ist zu einer ständigen Herausforderung geworden.

Nature, 2023. DOI: 10.1038/s41586-023-06792-0 (Über DOIs).

source site

Leave a Reply