KI sagt die Formen der kommenden Moleküle voraus


John McGeehan, Biologe und Direktor des Center for Enzyme Innovation in Portsmouth, England, sucht seit einigen Jahren nach einem Molekül, das die weltweit verstreuten 150 Millionen Tonnen Sodaflaschen und anderen Plastikmüll abbauen könnte.

In Zusammenarbeit mit Forschern auf beiden Seiten des Atlantiks hat er einige gute Möglichkeiten gefunden. Aber seine Aufgabe ist die des anspruchsvollsten Schlossers: die chemischen Verbindungen zu lokalisieren, die sich von selbst zu einer mikroskopischen Form verdrehen und falten, die perfekt in die Moleküle einer Plastikflasche passt und sie auseinanderspaltet, wie ein Schlüssel eine Tür öffnet .

Den genauen chemischen Gehalt eines bestimmten Enzyms zu bestimmen, ist heutzutage eine ziemlich einfache Herausforderung. Aber die Identifizierung seiner dreidimensionalen Form kann jahrelange biochemische Experimente erfordern. Nachdem er im vergangenen Herbst gelesen hatte, dass ein Labor für künstliche Intelligenz in London namens DeepMind ein System gebaut hatte, das automatisch die Formen von Enzymen und anderen Proteinen vorhersagt, fragte Dr. McGeehan das Labor, ob es bei seinem Projekt helfen könnte.

Gegen Ende einer Arbeitswoche schickte er DeepMind eine Liste mit sieben Enzymen. Am folgenden Montag gab das Labor Formen für alle sieben zurück. “Dies hat uns ein Jahr, wenn nicht sogar zwei Jahre voraus gebracht”, sagte Dr. McGeehan.

Jetzt kann jeder Biochemiker seine Arbeit auf ähnliche Weise beschleunigen. Am Donnerstag veröffentlichte DeepMind die vorhergesagten Formen von mehr als 350.000 Proteinen – die mikroskopischen Mechanismen, die das Verhalten von Bakterien, Viren, dem menschlichen Körper und allen anderen Lebewesen steuern. Diese neue Datenbank enthält die dreidimensionalen Strukturen aller Proteine, die vom menschlichen Genom exprimiert werden, sowie die von Proteinen, die in 20 anderen Organismen vorkommen, darunter die Maus, die Fruchtfliege und das E. coli-Bakterium.

Diese riesige und detaillierte biologische Karte – die ungefähr 250.000 bisher unbekannte Formen enthält – könnte die Fähigkeit verbessern, Krankheiten zu verstehen, neue Medikamente zu entwickeln und bestehende Medikamente wiederzuverwenden. Es kann auch zu neuartigen biologischen Werkzeugen führen, wie einem Enzym, das Plastikflaschen effizient abbaut und sie in Materialien umwandelt, die leicht wiederverwendet und recycelt werden können.

„Dies kann Sie in der Zeit voranbringen – beeinflussen Sie die Art und Weise, wie Sie über Probleme nachdenken und helfen Sie, sie schneller zu lösen“, sagte Gira Bhabha, Assistenzprofessorin in der Abteilung für Zellbiologie der New York University. „Ob Sie Neurowissenschaften oder Immunologie studieren – was auch immer Ihr Fachgebiet der Biologie ist – das kann nützlich sein.“

Dieses neue Wissen ist ein ganz eigener Schlüssel: Wenn Wissenschaftler die Form eines Proteins bestimmen können, können sie bestimmen, wie andere Moleküle daran binden. Dies könnte beispielsweise zeigen, wie Bakterien Antibiotika widerstehen – und wie man dieser Resistenz entgegenwirken kann. Bakterien widerstehen Antibiotika, indem sie bestimmte Proteine ​​exprimieren; Wenn Wissenschaftler die Formen dieser Proteine ​​identifizieren könnten, könnten sie neue Antibiotika oder neue Medikamente entwickeln, die sie unterdrücken.

In der Vergangenheit erforderte die Bestimmung der Form eines Proteins Monate, Jahre oder sogar Jahrzehnte von Trial-and-Error-Experimenten mit Röntgenstrahlen, Mikroskopen und anderen Werkzeugen auf dem Labortisch. Aber DeepMind kann die Timeline mit seiner KI-Technologie, bekannt als AlphaFold, erheblich verkürzen.

Als Dr. McGeehan DeepMind seine Liste mit sieben Enzymen schickte, sagte er dem Labor, dass er bereits Formen für zwei von ihnen identifiziert habe, aber er sagte nicht, welche zwei. Auf diese Weise konnte getestet werden, wie gut das System funktionierte; AlphaFold hat den Test bestanden und beide Formen richtig vorhergesagt.

Noch bemerkenswerter sei, sagte Dr. McGeehan, dass die Vorhersagen innerhalb weniger Tage eintrafen. Später erfuhr er, dass AlphaFold die Aufgabe tatsächlich in nur wenigen Stunden erledigt hatte.

AlphaFold sagt Proteinstrukturen mithilfe eines sogenannten neuronalen Netzwerks voraus, einem mathematischen System, das Aufgaben lernen kann, indem es riesige Datenmengen – in diesem Fall Tausende von bekannten Proteinen und ihre physikalischen Formen – analysiert und ins Unbekannte extrapoliert.

Dies ist dieselbe Technologie, die die Befehle, die Sie in Ihr Smartphone eingeben, erkennt, Gesichter in den Fotos erkennt, die Sie auf Facebook posten, und die bei Google Translate und anderen Diensten eine Sprache in eine andere übersetzt. Viele Experten glauben jedoch, dass AlphaFold eine der leistungsstärksten Anwendungen der Technologie ist.

„Es zeigt, dass KI inmitten der Komplexität der realen Welt nützliche Dinge tun kann“, sagte Jack Clark, einer der Autoren des KI-Index, um den Fortschritt der künstlichen Intelligenz auf der ganzen Welt zu verfolgen.

Wie Dr. McGeehan entdeckte, kann es bemerkenswert genau sein. AlphaFold kann die Form eines Proteins mit einer Genauigkeit vorhersagen, die in 63 Prozent der Fälle mit physikalischen Experimenten konkurrieren kann, laut unabhängigen Benchmark-Tests, die seine Vorhersagen mit bekannten Proteinstrukturen vergleichen. Die meisten Experten waren davon ausgegangen, dass eine so leistungsfähige Technologie noch Jahre entfernt war.

„Ich dachte, es würde noch 10 Jahre dauern“, sagte Randy Read, Professor an der University of Cambridge. “Das war eine komplette Veränderung.”

Die Genauigkeit des Systems variiert jedoch, sodass einige der Vorhersagen in der DeepMind-Datenbank weniger nützlich sind als andere. Jede Vorhersage in der Datenbank wird mit einem „Konfidenzwert“ geliefert, der angibt, wie genau sie wahrscheinlich sein wird. DeepMind-Forscher schätzen, dass das System in etwa 95 Prozent der Fälle eine „gute“ Vorhersage liefert.

Dadurch kann das System physikalische Experimente nicht vollständig ersetzen. Es wird neben der Arbeit auf dem Labortisch eingesetzt und hilft Wissenschaftlern, herauszufinden, welche Experimente sie durchführen sollten, und füllt die Lücken, wenn Experimente nicht erfolgreich sind. Mit AlphaFold haben Forscher der University of Colorado Boulder kürzlich dazu beigetragen, eine Proteinstruktur zu identifizieren, mit deren Identifizierung sie mehr als ein Jahrzehnt lang Schwierigkeiten hatten.

Die Entwickler von DeepMind haben sich dafür entschieden, ihre Datenbank mit Proteinstrukturen frei zu teilen, anstatt den Zugang zu verkaufen, in der Hoffnung, den Fortschritt in den biologischen Wissenschaften voranzutreiben. „Wir sind an maximaler Wirkung interessiert“, sagte Demis Hassabis, CEO und Mitbegründer von DeepMind, das sich im Besitz derselben Muttergesellschaft wie Google befindet, aber eher wie ein Forschungslabor als ein kommerzielles Unternehmen agiert.

Einige Wissenschaftler haben die neue Datenbank von DeepMind mit dem Human Genome Project verglichen. Das 2003 abgeschlossene Human Genome Project lieferte eine Karte aller menschlichen Gene. Jetzt hat DeepMind eine Karte der etwa 20.000 Proteine ​​bereitgestellt, die vom menschlichen Genom exprimiert werden – ein weiterer Schritt zum Verständnis der Funktionsweise unseres Körpers und der Reaktion auf Fehler.

Die Hoffnung ist auch, dass sich die Technologie weiterentwickeln wird. Ein Labor der University of Washington hat ein ähnliches System namens RoseTTAFold gebaut und wie DeepMind hat es den Computercode, der sein System steuert, offen geteilt. Jeder kann die Technologie nutzen und jeder kann daran arbeiten, sie zu verbessern.

Schon bevor DeepMind begann, seine Technologie und Daten offen zu teilen, speiste AlphaFold eine Vielzahl von Projekten. Forscher der University of Colorado nutzen die Technologie, um zu verstehen, wie Bakterien wie E. coli und Salmonellen eine Resistenz gegen Antibiotika entwickeln, und um Wege zu finden, diese Resistenz zu bekämpfen. An der University of California in San Francisco haben Forscher das Tool verwendet, um ihr Verständnis des Coronavirus zu verbessern.

Das Coronavirus richtet mit 26 verschiedenen Proteinen verheerende Folgen im Körper an. Mit Hilfe von AlphaFold haben die Forscher ihr Verständnis eines Schlüsselproteins verbessert und hoffen, dass die Technologie dazu beitragen kann, ihr Verständnis der anderen 25 zu verbessern.

Wenn dies zu spät kommt, um Auswirkungen auf die aktuelle Pandemie zu haben, könnte dies bei der Vorbereitung auf die nächste helfen. „Ein besseres Verständnis dieser Proteine ​​wird uns helfen, nicht nur dieses Virus, sondern auch andere Viren ins Visier zu nehmen“, sagte Kliment Verba, einer der Forscher in San Francisco.

Die Möglichkeiten sind vielfältig. Nachdem DeepMind Dr. McGeehan Formen für sieben Enzyme gegeben hatte, die möglicherweise die Welt von Plastikmüll befreien könnten, schickte er dem Labor eine Liste mit 93 weiteren. „Sie arbeiten jetzt daran“, sagte er.



Source link

Leave a Reply