Kürzlich hat die US-amerikanische Life Science-Firma Tahoe Bio (ehemals Vevo Therapeutics) ihre leistungsstarke KI-Basismodell – Tahoe-x1 (Tx1) – offiziell vorgestellt. Es handelt sich um ein 3 Milliarden Parameter umfassendes Modell, das speziell für die Entschlüsselung der komplexen Beziehungen zwischen Genen, Zellen und Medikamenten entwickelt wurde. Die Einführung dieses Modells markiert den Übergang von KI von einem „Hilfsmittel“ zu einem „Lebenssystem-Modellierungs-Engine“, und eröffnet neue Wege für die Entdeckung von Krebs-Zielstrukturen und personalisierten Therapien.

Architektur-Revolution: 3 Milliarden Parameter, speziell für die Einzelzellwelt
Tahoe-x1 basiert auf der Transformer-Encoding-Architektur und wird mit Masked Language Modeling (MLM) trainiert. Die Trainingsdaten umfassen beeindruckende 266 Millionen Einzelzell-Transkriptom-Profile, darunter auch das selbst erstellte Tahoe-100M-Störsatz-Datensatz von Tahoe Bio – ein Datensatz, der die Störungsreaktionen tausender Moleküle auf Krebszellen aufzeichnet und bereits in der globalen Wissenschaftsgemeinschaft fast 200.000 Mal heruntergeladen wurde.
Um Leistung und Praxistauglichkeit zu kombinieren, bietet die Modellfamilie verschiedene Größen (wie Tx1-70M), und durch Optimierungstechniken wie FlashAttention v2 erreicht es eine Berechnungseffizienz, die bis zu drei bis dreißig Mal höher ist als bei ähnlichen Zellmodellen. Selbst auf normalen GPUs kann es effizient laufen und senkt somit die Forschungshürden erheblich.
Fähigkeit 1: Präzise Identifizierung des „Schlüssels“ von Krebs, übertrifft alle vorhandenen Modelle
In der Aufgabe der Vorhersage der Gen-Essentialität (Gene Essentiality) übertrifft Tahoe-x1 in der renommierten DepMap-Datenbank alle vorhandenen Modelle und kann präzise die „zentralen Treiber-Gene“ identifizieren, die für das Überleben von Tumoren in unterschiedlichen Krebs-Subtypen erforderlich sind. Diese Fähigkeit hilft Forschern dabei, hochwertige Zielstrukturen schnell zu erkennen und den Zeitraum von der Entdeckung bis zur Validierung stark zu verkürzen, insbesondere für schwer behandelbare Krebsarten mit hoher Heterogenität.
Fähigkeit 2: Automatische Wiederherstellung der Krebsentstehungswege, enthüllt molekulare Zusammenarbeit
Das Modell kann nicht nur einzelne Gene identifizieren, sondern auch signalempfindliche Signalwege, die während der Krebsentstehung koordiniert aktiviert werden. In Tests mit der MSigDB-Datenbank erreicht Tahoe-x1 die höchste Genauigkeit bei der Wiederherstellung der „Krebszeichen-Wege“ (hallmark programs). Es kann automatisch wichtige biologische Prozesse wie unkontrollierte Zellzyklusaktivität oder Defekte in der DNA-Reparatur analysieren und so systematische Einblicke für kombinierte Mehrzieltherapien bieten.
Fähigkeit 3: Null-Sample-Vorhersage der Wirksamkeit von Medikamenten, virtuelle klinische Studien werden Realität
Am beeindruckendsten ist die Fähigkeit von Tahoe-x1 zur „Null-Sample-Verallgemeinerung“ – selbst bei Zelltypen oder Patientenproben, die das Modell noch nie gesehen hat, kann es auf Grundlage bestehenden Wissens „analoge Schlussfolgerungen“ ziehen und vorhersagen, wie sie auf bestimmte Medikamente reagieren. Das bedeutet, dass zukünftig die Entwicklung von Medikamenten im Computer tausende von Behandlungsvarianten simulieren kann, um die vielversprechendsten Kombinationen auszuwählen, bevor sie in Labor- oder Klinikphasen eintreten. Dies reduziert deutlich die Fehlerkosten und die Erfolgsquote.
Mit dem nachtrainierten Rahmen kann das Modell außerdem verschiedenen Patientenhintergründen angepasst werden und beschleunigt so die Umsetzung personalisierter Krebstherapien.
AIbase-Beobachtung: Open Source + datengetrieben, BiokI-Ökosystem beschleunigt seine Reife
Tahoe Bio hat insgesamt 42 Millionen Dollar gesammelt und baut derzeit das größte Einzelzell-Störschema der Welt mit Ziel von 1 Milliarde Datenpunkten auf. Bei dieser Gelegenheit veröffentlichte Tahoe-x1 nicht nur die Modellgewichte (Hugging Face) und den Code (GitHub), sondern bietet auch eine interaktive Demo an. Der Preprint ist bereits auf bioRxiv online und verpflichtet sich vollständig der wissenschaftlichen Gemeinschaft.
AIbase glaubt, dass der wahre Durchbruch von Tahoe-x1 darin besteht, dass es KI vom „statistischen Korrelationsniveau“ auf „mechanisches Verständnis“ bringt. Wenn das Modell wie ein Biologe denkt, wie Gene reguliert werden, wie Medikamente eingreifen und wie Zellen darauf reagieren, wird das Modell der medizinischen Forschung von einer „Test-und-Fehler-Methode“ zu einer „Vorhersagemethode“ wechseln.





