Da AI-Unternehmen reifer werden, ist die Konkurrenz um hochwertige Daten zu einem der intensivsten Kämpfe im gesamten Branchen geworden. Dies hat Unternehmen wie Mercor und Surge hervorgebracht, wobei Scale AI, gegründet von Alexandr Wang, besonders auffällt. Doch nun hat Wang die AI-Abteilung bei Meta übernommen, und viele Investoren sehen darin eine Gelegenheit, Geld in Unternehmen zu stecken, die über überzeugende neue Strategien zur Sammlung von Trainingsdaten verfügen.

Datacurve, ein Unternehmen, das aus Y Combinator hervorgegangen ist, ist genau solch eine Firma. Es konzentriert sich auf die Bereitstellung von hochwertigen Daten für die Softwareentwicklung. Am Donnerstag gab das Unternehmen die Abschlussfinanzierung in Höhe von 15 Millionen Dollar bekannt, angeführt durch Mark Goldberg von Chemistry, mit Beteiligung von Mitarbeitern aus DeepMind, Vercel, Anthropic und OpenAI. Vorher hatte das Unternehmen auch eine Seed-Finanzierung in Höhe von 270.000 Dollar abgeschlossen, an der der ehemalige CTO von Coinbase, Balaji Srinivasan, beteiligt war.

Investition, Finanzierung, Geld

Datacurve nutzt ein Belohnungssystem, um erfahrene Softwareentwickler zu motivieren, die schwierigsten Datensätze zu erstellen. Das Unternehmen zahlt für diese Beiträge und hat bisher mehr als eine Million Dollar an Belohnungen ausgezahlt.

Doch Serana Ge, Mitbegründerin, sagte, dass das größte Motiv nicht das Geld sei. Für Dienstleistungen wie Softwareentwicklung sind die Bezahlungen für Datenarbeit immer noch weit unter den traditionellen Arbeitsverhältnissen. Daher ist das wichtigste Plus des Unternehmens die positive Benutzererfahrung.

Ge sagte, sie betrachten dies als ein Konsumprodukt, nicht als eine Datenmarkierungsaufgabe. Sie haben viel Zeit damit verbracht, zu überlegen, wie man Menschen interessiert und auf die Plattform bringt.

Dies ist besonders wichtig, wenn die Anforderungen an Trainingsdaten komplexer werden. Frühere Modelle wurden auf einfachen Datensätzen trainiert, während heutige AI-Produkte komplexe Verstärkungslernumgebungen benötigen, die durch spezifische und strategische Datensammlung gebaut werden. Je komplexer die Umgebungen werden, desto strenger werden die Anforderungen an die Menge und Qualität der Daten, was diesem Trend vorteilhaft sein könnte.

Als frühes Unternehmen konzentriert sich Datacurve derzeit auf den Bereich Softwareentwicklung, aber Ge sagte, dass dieses Modell auch für Bereiche wie Finanzen, Marketing oder sogar Medizin funktioniert.

Ge erklärte, dass sie im Moment eine Infrastruktur für die Nachtrainingsdatensammlung schaffen und qualifizierte Fachkräfte in verschiedenen Bereichen anziehen und halten möchten.