Der Spielvideo-Teilungsplattform Medal hat kürzlich ein eigenes AI-Forschungslabor namens General Intuition gegründet und eine Seed-Finanzierung von 133,7 Millionen US-Dollar abgeschlossen. Die Finanzierung wurde von Khosla Ventures und General Catalyst angeführt, mit Beteiligung von Raine. Das junge Unternehmen nutzt die umfangreichen Spielvideo-Daten von Medal, um Grundmodell und KI-Agenten zu trainieren, und konzentriert sich darauf, zu verstehen, wie Objekte und Entitäten sich räumlich und zeitlich bewegen – diese Fähigkeit wird als räumlich-zeitliches Schlussfolgern bezeichnet.

General Intuition ist der Ansicht, dass das Datenbank von Medal bei der Ausbildung von Agenten besser ist als Plattformen wie Twitch oder YouTube. Diese Datenbank enthält jährlich 2 Milliarden Videos von 10 Millionen aktiven Nutzern, die tausende Spiele abdecken. Der CEO von Medal und General Intuition, Pim de Witte, erklärte, dass die von Spielern hochgeladenen Videoclips oft extreme positive oder negative Fälle sind, was gerade für das Training wertvolle Randdaten bietet. „Sie erhalten eine Auswahlverzerrung, die genau auf die Art von Daten zielt, die Sie für Ihre Arbeit benötigen.“

Diese Datenvorteile haben laut Berichten die Aufmerksamkeit von OpenAI erregt. Laut Informationen des The Information versuchte OpenAI letztes Jahr, Medal für 5 Milliarden US-Dollar zu kaufen, doch weder OpenAI noch General Intuition haben auf diesen Bericht geantwortet.

Auf technischer Ebene hat das Gründungsteam bereits einige Durchbrüche erzielt. Die Modelle von General Intuition können Umgebungen verstehen, die sie nicht trainiert haben, und die dazugehörigen Handlungen korrekt vorhersagen. Dieses Modell erreicht dies vollständig durch visuelle Eingaben – der Agent sieht nur das, was menschliche Spieler sehen, und bewegt sich räumlich über Controller-Eingaben. Die Firma erklärt, dass dieser Ansatz sich natürlicherweise auf physische Systeme wie Roboterarme, Drohnen und autonome Fahrzeuge übertragen lässt, da diese Geräte normalerweise über Spielkonsolen bedient werden.

Die nächsten Meilensteine von General Intuition umfassen zwei Richtungen: die Erstellung neuer Simulationswelten zur Trainierung anderer Agenten sowie die selbständige Navigation in völlig fremden physischen Umgebungen.

In Bezug auf die kommerzielle Strategie unterscheidet sich General Intuition deutlich von anderen Entwicklern von Weltmodellen. Obwohl das Unternehmen auch Weltenmodelle für die Ausbildung von Agenten baut, sind diese Modelle an sich nicht das Produkt. Im Gegensatz zu DeepMind und World Labs, die ihre Weltenmodelle Genie und Marble zum Training von Agenten und zur Inhaltserstellung verkaufen, hat General Intuition andere Anwendungsbereiche gewählt, um Urheberrechtsprobleme zu vermeiden.

de Witte betonte klar: „Unser Ziel ist es nicht, Modelle zu produzieren, die mit Spielentwicklern konkurrieren.“ Stattdessen konzentriert sich das Spiel-Anwendungsprojekt des Unternehmens auf die Erstellung von Robotern und nicht-spielerischen Charakteren, die über die traditionellen „deterministischen Roboter“ hinausgehen – also vorgeprogrammierte Charaktere, die immer dieselbe Ausgabe liefern.

Ein Gründungsmitglied von General Intuition und Partner bei Lightspeed Ventures, Moritz Baier-Lentz, sagte: „Diese Roboter können auf jede Schwierigkeitsstufe ausgedehnt werden. Ein unbesiegbarer Roboter, der alle besiegt, ist nicht attraktiv, aber wenn Sie schrittweise erweitern und den Fluss für jede Spieler-Situation füllen können, sodass ihre Siegchance stets etwa 50 % bleibt, maximiert dies ihre Teilnahme und Kundenbindung.“

de Witte hat zudem humanitäre Erfahrungen, was den Fokus des Unternehmens auf Such- und Rettungsdrohnen beeinflusste. Solche Drohnen müssen manchmal in Umgebungen navigieren, in denen kein GPS verfügbar ist, und Informationen extrahieren.

Aus langfristiger Sicht betrachten de Witte und Baier-Lentz die Kernkompetenz von General Intuition – räumlich-zeitliches Schlussfolgern – als einen Schlüsselabschnitt auf dem Weg zu einer allgemeinen Künstlichen Intelligenz (AGI). Während die Haupt-IA-Labore sich darauf konzentrieren, leistungsstärkere große Sprachmodelle zu bauen, ist General Intuition der Ansicht, dass echte AGI etwas braucht, was große Sprachmodelle grundsätzlich fehlt.

de Witte sagte: „Als Mensch erstellen wir Texte, um Ereignisse in unserer Welt zu beschreiben, doch dabei verlieren wir viele Informationen. Wir verlieren die allgemeine Intuition im Zusammenhang mit räumlich-zeitlichem Schlussfolgern.“

Die hohe Seed-Finanzierung spiegelt das Vertrauen der Investoren in den Bereich der räumlichen Intelligenz wider. Im Unterschied zu traditionellen KI-Modellen, die die Welt durch Text und Bilder verstehen, konzentriert sich räumlich-zeitliches Schlussfolgern auf dynamische Veränderungen und Ursachen im physischen Raum. General Intuition plant, mit dem Geld die Forscher- und Ingenieurteams zu vergrößern, um allgemeine intelligente Agenten zu trainieren, die mit ihrer Umgebung interagieren können. Zu Beginn werden die Anwendungen auf Spiele und Such- und Rettungsdrohnen fokussiert. In technischer Hinsicht bedeutet die Nutzung von Spielvideos, um KI mit Verständnis der physischen Welt zu trainieren, eine neue Idee, virtuelle Umgebungs-Erfahrungen auf reale Aufgaben zu übertragen.