Forscher der UC Santa Cruz sammeln mehr als 10 Millionen Coronavirus-Varianten – Santa Cruz Sentinel

SANTA CRUZ – Forscher der UC Santa Cruz haben mehr als 10 Millionen genetische Varianten des COVID-19-Virus aus der ganzen Welt zusammengestellt und sie in einem Stammbaum organisiert, der die Entwicklung des Coronavirus abbildet.

„Diese Datenmenge ist wirklich beispiellos“, sagte Angie Hinrichs, Bioinformatik-Programmiererin an der UC Santa Cruz. „Wir hatten noch nie zuvor so viele Genome derselben Spezies.“

Im Februar 2020, nachdem der erste Coronavirus-Stamm verfügbar wurde, passten die Forscher der UC Santa Cruz das Design ihres bestehenden Genombrowsers an und erstellten einen speziell für die Speicherung und Anzeige der gesammelten genetischen Varianten des COVID-19-Virus. Sobald der Browser gebaut war, überschwemmten täglich Tausende von Coronavirus-Sequenzen von Forschern aus den USA und international. Forscher der UC Santa Cruz hatten Schwierigkeiten, den massiven Datenzufluss zu bewältigen.

„Die Werkzeuge, die vor der Pandemie zum Erstellen von Stammbäumen zur Verfügung standen, konnten einige tausend Genomsequenzen verarbeiten, aber plötzlich hatten wir Zehntausende“, sagte Hinrichs, der seit mehr als 20 Jahren mit dem Genombrowser der Universität arbeitet.

Vor diesem Hintergrund wurde ein Forscherteam zusammengestellt, darunter auch Hinrichs, um die unergründliche Menge an Informationen in Form eines phylogenetischen Stammbaums zusammenzufassen, ähnlich einem Stammbaum des Virus. Ein Mitglied des Teams, damals Postdoktorand, Yatish Turakhia, schrieb ein neues Softwareprogramm namens UShER, das es Wissenschaftlern ermöglichte, die Coronavirus-Varianten schnell und genau auf dem massiven Stammbaum zu organisieren, der im Coronavirus-spezifischen Browser der Universität gespeichert ist. Die Anzahl der Varianten in der Datenbank hat im Juni zehn Millionen überschritten.

Zum Vergleich der Statistiken ist die Art mit der nächsthöchsten Anzahl gesammelter Sequenzen im Genombrowser der UC Santa Cruz E. coli mit etwas mehr als 5 Millionen Genomsequenzen, was etwa der Hälfte der gesammelten Coronavirus-Stämme entspricht. Hinrichs weist darauf hin, dass E. Coli seit Jahrzehnten von Wissenschaftlern untersucht wird.

siehe auch  Little Noah ist ein lässiger Roguelite mit bezaubernden Vibes, jetzt für Switch erhältlich

Der Coronavirus-Genom-Browser der Universität und der phylogenetische Stammbaum, den er beherbergt, haben es Wissenschaftlern und Forschern ermöglicht, die Geschichte des Virus auf seiner geografischen Reise zu verfolgen, neue Abstammungslinien und tödliche Varianten wie Omicron oder BA.1 und BA.2 zu identifizieren, wenn sie aufgerufen werden des Baums und sagen Superspreader-Ereignisse oder andere potenziell gefährliche Phänomene voraus, die in den Teeblättern des phylogenetischen Baums vorhersehbar sind, während er weiter wächst.

„Ich wünschte, die Pandemie würde verschwinden und die Sequenzen würden nicht mehr einfließen, und ich könnte dieses Projekt abschließen, aber es ist noch nicht passiert“, sagte Heinrich. „Solange sich das Virus weiterentwickelt, werden wir weiter auf diesem Baum aufbauen, damit wir zumindest verstehen können, was es tut.“

COVID-19-Sequenzen aus der ganzen Welt werden von UCSC-Forschern zu einem Stammbaum zusammengesetzt, der die Evolutionsgeschichte des Virus zeigt. Bildnachweis: Carolyn Lagattuta

Newsletter

Leave a Reply

Your email address will not be published.

This site uses Akismet to reduce spam. Learn how your comment data is processed.