None

Forscher finden mit KI Tausende neue Virusarten

Mit KI-Unterstützung entdeckten Forscher über 160.000 potenzielle RNA-Virusarten.
Corona Borealis Studio/Shutterstock.com



In Zusammenarbeit mit Alibaba Cloud, der chinesischen Sun Yat-sen-Universität und der University of Sydney in Australien haben Forscher einen Deep-Learning-Algorithmus vorgestellt, der Künstliche Intelligenz zur Erkennung von RNA-Viren nutzt.



Damit gelang es den Forschern, im Rahmen einer Studie über 160.000 potenzielle RNA-Virusarten und 180 RNA-Virus-Supergruppen zu entdecken. Die Studie wurde in der begutachteten Fachzeitschrift Cell veröffentlicht.



KI-Modell LucaProt



Für die KI wurde das Modell „LucaProt“ verwendet. Es verbessert, wie es heißt, den Prozess der Virenerkennung, indem es Proben auf Proteinsequenzen und strukturelle Merkmale analysiert und Forschern dabei hilft, Tausende potenzieller Viren zu entdecken.



Für die Studie wandten die Forscher LucaProt auf einen Datensatz von 10.487 Metatranskriptomen aus verschiedenen Ökosystemen an und beobachteten, wie der Algorithmus 161.979 potenzielle neue Virusspezies und 180 neue RNA-Virus-Supergruppen identifizierte.



Hohe Genauigkeit dank KI



Die neu entdeckten Viren waren in einer Reihe von Umgebungen vorhanden. Das Spektrum reichte von der Luft über heiße Quellen bis hin zu hydrothermalen Quellen. Dabei variierten die Vielfalt und Häufigkeit der Viren erheblich zwischen den verschiedenen Quellen. Die Studie ist die größte jemals veröffentlichte Entdeckung von Virusarten, was die Anzahl der identifizierten Arten betrifft.


KI eröffnet Forschern und Medizinern neue Einblicke in die Welt der Viren.metamorworks/Shutterstock.com



LucaProt weist eine hervorragende Genauigkeit (0,014 Prozent falsch-positive Ergebnisse) und Spezifität (1,72 Prozent falsch-negative Ergebnisse) bei Testdatensätzen auf. Um dies zu erreichen, hat Alibaba Cloud mehrere KI-gesteuerte Erkennungswerkzeuge vorgestellt.



KI für Genomik und Epidemiologie



Diese können die Muster und Merkmale in komplexen Daten in Bereichen wie der mikrobiellen Genomik und Epidemiologie identifizieren. Zu den spezialisierten Modellen gehören ein einheitliches Basismodell für Nukleinsäuren und Proteine namens LucaOne und ein Protein-Sprachmodell namens LucaPcycle.



Für Forscher und Medizin eröffnet der KI-Einsatz, neue Wege, um Viren, Bakterien und Parasiten entdecken zu können. Bislang mussten sie sich bei der Entdeckung von Viren auf langwierige Bioinformatik-Pipelines verlassen, was die Vielfalt der Erforschung einschränkte. Dagegen erlaube es das KI-Modell mit seiner Sensitivität und Spezifität, viel tiefer in die virale Vielfalt einzutauchen.



KI gibt Einblick in Welt der Viren



Mit Hilfe der KI, so Edward Holmes, leitender Autor der Studie und Professor an der School of Medical Sciences der Fakultät für Medizin und Gesundheit der Universität Sydney, „haben wir einen Einblick in einen ansonsten verborgenen Teil des Lebens auf der Erde erhalten, der eine bemerkenswerte Artenvielfalt offenbart“.



Gleichzeitig verbindet sich damit die Hoffnung, Krankheiten oder Epidemien frühzeitig erkennen und bekämpfen zu können. Schließlich sind RNA-Viren die Ursache für zahlreiche Krankheiten.



Deshalb ist das Verständnis der Evolution dieser Viren für die öffentliche Gesundheit von entscheidender Bedeutung. Herkömmliche Methoden zur Virusidentifizierung, die auf Sequenzähnlichkeit beruhen, können jedoch unbekannte Viren übersehen und so einen ganzen Bereich von Viren unerreichbar machen – bis jetzt.