Chemie-Nobelpreis: KI machte Proteinstrukturen für alle zugänglich
Der Chemie-Nobelpreis 2024 überraschte auch den Wiener Strukturbiologen David Haselbach nicht. Der "für computergestütztes Proteindesign" ausgezeichnete David Baker war - bevor es Modelle der Künstlichen Intelligenz (KI) gab - "der große Name", auch in der Vorhersage der Proteinstruktur. Das von Demis Hassabis und John Jumper vorgestellte KI-Modell "AlphaFold" habe ihn dann "quasi überholt", die KI habe Proteinstrukturen den gesamten Lebenswissenschaften zugänglich gemacht.
Mit der Vergabe des Physik-Nobelpreises im Bereich des maschinellen Lernens mutmaßte Haselbach bereits am Dienstag auf "X" (ehemals Twitter), dass mit dieser Honorierung des "größeren Rahmens der KI" wahrscheinlich die spezielle Anwendung in der Chemie am Folgetag geehrt werden könnte - also die von Jumper und Hassabis entwickelte "AlphaFold Protein Structure Database". Sie habe insbesondere für die molekularen Lebenswissenschaften einen enormen Impakt gehabt, so der Forscher.
Viel Potenzial für die Zukunft
Beim Proteindesign gehe es primär um die künstliche Herstellung (Synthetisierung) von Proteinen. "Es gibt ein beschränktes Set von Proteinen, die es von der Natur aus gibt", erläuterte der Gruppenleiter am Institut für Molekulare Pathologie (IMP) in Wien. Von diesen kenne man die meisten. Proteindesign käme dann ins Spiel, wenn man mit Proteinen, etwa Enzymen, ermöglichen möchte, z.B. eine ganz spezielle Reaktion zu katalysieren - also etwas, was so von Natur aus nicht möglich ist. Man habe den Baukasten um künstliche Proteine erweitert, so Haselbach. Aber man stehe am Anfang, sie tatsächlich mit bestimmten Zweck einzusetzen, etwa im Bereich der Biotechnologie oder zur Herstellung von neuen Substanzen: "Dies hat allerdings viel Potenzial für die Zukunft, etwa auch in der Medizin", so der Experte: "Man kann sich etwa ein synthetisches Protein vorstellen, das einen Virus-Rezeptor blockt - das könnten einmal eine potenzielle Anwendungen sein."
Mit AlphaFold "kam ein absoluter wissenschaftlicher Durchbruch, mit kaum vergleichbarer Tragweite", so Haselbach - vielleicht vergleichbar mit der Entdeckung der Genschere Crispr/Cas. Die Struktur von einem Protein zu lösen, dauerte bisher Jahre - das sei hoch komplex. Heute könne man mit einer relativ hohen Genauigkeit die Proteinstruktur der großen Mehrheit von humanen Proteinen vorhersagen. Selbst jene, die sich nicht direkt für Proteinstrukturen interessieren, könnten ohne großen Aufwand, "in zehn Minuten eine Struktur von ihrem Protein haben". Es brauche nur einen "Google-Account" und die Sequenz der Aminosäuren des Proteins. Mit der heuer vorgestellten Version "AlphaFold 3" könne man nun auch mehrere Proteine, die sich etwa als Komplex verbunden haben, vorhersagen. "Jeder kann das: Man muss nur auf Start klicken - kurz darauf habe ich eine Struktur."
Mit der 3-D-Struktur "Bindetaschen" entdecken
Mit der vorhergesagten 3-D-Struktur der Proteine könne man z.B. erkennen, wo es "Bindetaschen" und damit Anbindungsstellen für kleinere Moleküle geben könnte, wo es bindungsrelevante Oberflächen gibt, oder welche Proteinfunktion sich aus der Struktur ableiten lässt.
KI-Modelle wie AlphaFold pushen auch entsprechende Ansätze, künstliche Proteine gezielt für bestimmte Zwecke einzusetzen. Hier schließt sich also ein Kreis: "Ich habe mit Leuten vom Baker-Lab gesprochen. Nein, sie fühlen sich nicht von der Entwicklung überholt, sondern sie finden es richtig gut, da es sie im Proteindesign absolut beschleunigt", so der IMP-Forscher.
Da es beim KI-Modell immer noch eine gewisse Fehlerquote gibt und Falsch-Positive bei Proteinstrukturen ausgeworfen werden - bei "Alpha 3" liege die Quote bei etwa zehn Prozent-, "braucht es auch noch experimentelle Daten, um die Strukturen zu beweisen", so Haselbach: "Deswegen sind Strukturbiologen wie ich noch nicht aus dem Feld raus. Es gibt noch genug zu beweisen, dass die Vorhersage auch richtig war."