Die Poetik der Mutation: Künstliche Intelligenz kann helfen, entkommende Viren zu untersuchen

Quelle



Bioinformatists hat einen Algorithmus entwickeltum zu simulieren die menschliche Sprache vorherzusagenwie Viren könnten gegen das Immunsystem zu verteidigen entwickeln.



Die Kopie ist falsch



Viren führen eine eher primitive zyklische Existenz. Sie dringen in die Zelle ein, hacken ihre Fortpflanzungsmechanismen und schaffen ein Kopiergerät für ihre eigene Art. Virusrepliken verbreiten sich im ganzen Körper mit dem gleichen Zweck: zu erfassen und zu unterdrücken. Und so weiter bis ins Unendliche.



Sehr oft geht in der Reihenfolge dieses Kopierens und Einfügens etwas schief - Fehler beim Kopieren führen zu Mutationen. Manchmal betrifft eine Mutation das Fehlen eines wichtigen Proteins oder einer wichtigen Aminosäure - ein solches unglückliches Virus wird in den Mülleimer der Evolutionsgeschichte geschickt. Manchmal hat eine Mutation keinerlei Auswirkungen: Wenn die Begriffe in der Proteinsequenz neu angeordnet werden, ändert sich die Summe nicht.



Aber von Zeit zu Zeit wirkt die Mutation in die Hände des Virus. Die aufgetretenen Änderungen verhindern nicht nur, dass das Virus weiterhin gesunde Zellen erfasst, sondern tragen auch dazu bei, dies effizienter zu tun. Mutationen können dazu führen, dass das Virus für die Immunabwehr einer Person nicht mehr erkennbar ist. Ein solcher Eindringling schafft es, den Antikörpern auszuweichen, die bei kranken oder geimpften Menschen entwickelt wurden, oder "wegzurutschen".



Wissenschaftler sind immer auf der Suche nach möglichen Fluchtversuchen. Dies gilt auch für SARS-CoV-2: Neue Stämme erscheinen und Wissenschaftler untersuchen, wie kritisch diese Änderungen für den vorhandenen Impfstoff sind (PS Bisher ist alles in Ordnung). Am schwierigsten ist es für Forscher des Influenzavirus und von HIV, die sich am besten der Immunabwehr unseres Körpers "entziehen".



Virologen versuchen, der Kurve voraus zu sein, also erstellen sie im Labor ihre eigenen Mutanten und prüfen, ob sie den Antikörpern entkommen können, die Ex-Patienten entnommen und geimpft wurden. Diese Arbeit ähnelt jedoch der Suche nach einer Nadel im Heuhaufen: Die Variationen der Mutationen sind so unterschiedlich, dass nicht alles überprüft werden kann. Solche Studien werden eher durchgeführt, um die relative Kontrolle über die Situation nicht zu verlieren.



Virale Rechtschreibung



Im vergangenen Winter hat Brian Hee, Bioinformatiker am MIT und großer Fan von John Donnes Gedichten , über dieses Problem nachgedacht und eine interessante Analogie gefunden. Was ist, wenn wir virale Sequenzen genauso betrachten wie geschriebene Sprache? Laut dem Wissenschaftler hat jede virale Sequenz eine Art Grammatik - eine Reihe von Regeln, denen sie folgen muss, um dieses bestimmte Virus zu sein.



Wenn die Mutation einen "Grammatikfehler" hervorruft, tritt das Virus in eine evolutionäre Sackgasse ein. Genau wie die Sprache hat die Virussequenz eine Art Semantik, die das Immunsystem entweder lesen kann oder nicht. Wenn sie es liest, kann das Immunsystem das Virus verstehen und es mit Antikörpern oder anderen Schutzmitteln stoppen. In Fortsetzung der Analogie kann die virale "Flucht" als eine Änderung angesehen werden, die den Regeln der Grammatik folgt, aber ihre Semantik in eine ändert, die die Immunität nicht liest.



Die Analogie war nicht nur schön, sondern gab Brian Hee auch die Idee ihrer praktischen Anwendung. In den letzten Jahren hat die künstliche Intelligenz auf dem Gebiet der Linguistik große Fortschritte gemacht und die Prinzipien der Grammatik und Semantik der menschlichen Sprache korrekt modelliert. Neuronale Netze werden an Datensätzen trainiert, die aus Milliarden von Wörtern bestehen und nach Sätzen und Absätzen geordnet sind, aus denen das System Muster ableitet. Als Ergebnis des Trainings "verstehen" KI-Algorithmen, wie man Sätze richtig konstruiert und wo man Kommas setzt. Wir können auch sagen, dass er die Bedeutung bestimmter Wort- und Phrasenfolgen "versteht" und sogar den Kontext berücksichtigt - all dies basiert auf korrekt ausgewählten Koeffizienten der Schichten des neuronalen Netzwerks.



Die Architektur von Mustern zur Auswahl eines bestimmten Wortes ist großräumig und wird immer detaillierter vorgeschrieben. Zum Beispiel lernen die fortschrittlichsten Algorithmen zur Verarbeitung natürlicher Sprache wie GPT-3 von OpenAI , grammatikalisch ideale Texte zu erstellen, während der Stil beibehalten wird.



Sowohl in der Literatur als auch in der Biologie



Der Hauptvorteil von Algorithmen für künstliche Intelligenz ist ihre Skalierbarkeit für verschiedene Bereiche der Wissenschaft. Für ein Modell des maschinellen Lernens ist eine Sequenz eine Sequenz, unabhängig davon, wo sie sich in lyrischen Sonetten oder Aminosäuren befindet.



Laut Jeremy Howard, einem Forscher für künstliche Intelligenz an der Universität von San Francisco und Experte für Algorithmen zur Verarbeitung natürlicher Sprache, kann die Verwendung von KI-Algorithmen in der biologischen Forschung von Vorteil sein.



Mit einer ausreichenden Datenmenge, beispielsweise aus den der Wissenschaft bekannten genetischen Sequenzen infektiöser Viren, kann das Modell Muster und Muster in ihrer Struktur erkennen.



"Es wird ein äußerst komplexes Modell sein."Sagt Jeremy Howard. Brian Hee wusste es auch. Seine wissenschaftliche Beraterin, Mathematikerin und Programmiererin Bonnie Berger, hat zuvor ähnliche Arbeiten mit Kollegen im Labor durchgeführt und mithilfe von KI Proteinfaltungsmuster vorhergesagt.



Sprachmodelle für Influenza, HIV und Coronavirus



In diesem Frühjahr hat Bergers Labor Brian Hees Idee zum Leben erweckt. Die Forschungsergebnisse werden in der Zeitschrift Science veröffentlicht . Das Team war anfangs an Influenza und HIV interessiert, die für ihre meisterhafte Umgehung von Impfstoffen berüchtigt sind. Als sie jedoch im März 2020 mit der Studie begannen, wurde das Genom des neuen Coronavirus verfügbar, und sie beschlossen, dies ebenfalls in die Studie aufzunehmen.



Bei allen drei Viren konzentrierten sich die Wissenschaftler auf die Proteinsequenzen, mit denen sie in Zellen eindringen und sich replizieren, erklärt Brian Bryson, Bioingenieur, MIT-Professor und Mitautor der Studie. Dieselben Sequenzen sind das Hauptziel für eine Immunantwort und der Schlüssel zur Schaffung eines wirksamen Impfstoffs. Hier klammern sich Antikörper an das Virus, verhindern, dass es in die Zelle eindringt und zur Zerstörung verurteilt wird (für SARS-CoV-2 ist dies das S-Spike-Protein). Für jedes Virus trainierte das MIT-Team ein Sprachmodell unter Verwendung genetischer Sequenzdaten anstelle der üblichen Absätze und Sätze.



Nach einer Weile überprüften die Wissenschaftler das Ergebnis des Trainings des Modells. Nach der Hypothese von Wissenschaftlern sollten Sequenzen mit ähnlicher Semantik dieselben "Wirte" infizieren. Daher sollte die genetische "Sprache" der Schweinegrippe einer anderen Schweinegrippe semantisch ähnlich sein und sich von einem anderen Subtyp der Influenza, beispielsweise der Vogelgrippe, unterscheiden. Die Hypothese der Wissenschaftler wurde bestätigt. Darüber hinaus stellten sie fest, dass über die Zeit verteilte Influenzastämme (zum Beispiel die Vogelgrippe von 1918 und 2009) von der KI als semantisch ähnlich beurteilt wurden.



Dann wandten sie sich der Grammatik zu. Wie korreliert die Bewertung des Virus für die "Grammatik" der Sequenz und ihre Lebensfähigkeit im wirklichen Leben? Wissenschaftler haben Daten aus früheren Studien gesammelt, in denen die Anpassungsfähigkeit mutierter Viren (wie gut sie Zellen angegriffen und repliziert haben) für alle drei Viren bewertet wurde. Sie bewerteten dann, wie grammatikalisch korrekt diese Sequenzen gemäß dem Modell waren. Die Forscher gingen davon aus, dass eine hohe Punktzahl für diesen Parameter eine hohe Anpassungsfähigkeit des Virus bedeutet.



Bryson und Hee wollten auch wissen, ob AI die Entstehung eines "Flucht" -Virus vorhersagen kann. Dann verglichen sie die Vorhersagen ihres Modells mit den bekannten Fällen der tatsächlichen "Flucht" des Virus. Das Influenzavirusmodell erwies sich als das prädiktivste. Es überrascht nicht, dass der Datensatz, mit dem sie dieses Modell trainierten, der vollständigste war - er enthielt über mehrere Jahre akkumulierte Grippesequenzen, einschließlich überlebender Mutationen.



Was SARS-CoV-2 betrifft, haben Wissenschaftler ihre Hypothesen an künstlich gezüchteten Mutanten getestet. Das vorhandene Virus wurde wiederholt mit Antikörpern durch das Serum geleitet, bis das Virus zu einem für sie toleranten Stadium mutierte (wir haben wirklich noch nichts zu befürchten). Die Erfolgsquote war hier niedriger. Das Modell wählte die meisten wahren Flüchtlinge aus, war aber manchmal falsch.





Dennoch sind die erzielten Ergebnisse ein guter Ausgangspunkt für weitere Forschungen von Virologen, die verstehen wollen, wie der Mechanismus der natürlichen Mutation funktioniert. "Dies ist eine großartige Möglichkeit, das Universum potenzieller mutierter Viren einzugrenzen", kommentiert Benhour Lee, Mikrobiologe an der Icahn School of Medicine am Berg Sinai.



Der Wissenschaftler fügte hinzu, dass Vorhersagen genauso gut sind wie die Daten, auf denen das Modell trainiert wird. Es sollte auch berücksichtigt werden, dass das KI-Modell einige Nuancen übersieht, da die Fluchteigenschaft nicht immer eine Folge von Mutationen ist. HIV ist ein Beweis dafür. Manchmal ändert sich die Sequenz dieses Virus nicht und seine Proteine ​​werden sogar von Antikörpern erkannt, aber sie sind durch ein Polysaccharid namens Glycan gut geschützt.



Benhour Lee bemerkte, dass KI-Vorhersagen in erster Linie Forschern helfen, vorhandenes Wissen zu bestätigen. Das Modell identifizierte also korrekt zwei Teile des SARS-CoV-2-Spike-Proteins, die, wie bereits festgestellt wurde, anfälliger für Mutationen sind, und eine Region der Virussequenz, die stabil ist, was bedeutet, dass es ein gutes Ziel für Antikörper ist.



Die Zeit wird zeigen, zu welchen anderen Entdeckungen die Prognosen des KI-Modells führen werden. Bisher haben Wissenschaftler besondere Hoffnungen auf die Identifizierung der sogenannten kombinativen Mutationen gesetzt, zu denen viele überlagerte Veränderungen gehören.



Der nächste Schritt, den Brysons Mitarbeiter unternehmen werden, besteht darin, im Labor einige der vorhergesagten Mutanten von SARS-CoV-2 zu erstellen und ihre Reaktion auf Antikörper zu überwachen, die kranken und geimpften Menschen entnommen wurden. Sie werden auch mehrere Sequenzen testen, die aus Versuchen stammen, Virusproben von Patienten mit Covid-19 zu sequenzieren, von denen das Modell glaubt, dass sie anfälliger für Flucht sind, sagte Bryson.



Wissenschaftler wollen auch testen, ob ihre Analogie für andere Situationen gilt. Könnte ein ähnliches Modell vorhersagen, ob das Immunsystem eine bestimmte Krebsbehandlung nicht mehr verträgt oder ob Krebszellen mutieren und nicht mehr auf die Behandlung ansprechen? Mit genügend Daten in der Hand möchte Brysons Labor dies auch testen.






All Articles