एआई कंपनियां परिपक्व होती जा रही हैं, तो उच्च गुणवत्ता वाले डेटा के लिए प्रतिस्पर्धा पूरे उद्योग में सबसे अधिक तीव्र लड़ाई में बदल गई है, जिसके परिणामस्वरूप मर्कोर और सर्ज जैसी कंपनियों की उत्पत्ति हुई, जिनमें सबसे अधिक ध्यान आकर्षित करने वाली स्केल एआई है, जिसकी स्थापना एलेक्सेंडर वॉंग द्वारा की गई थी। लेकिन अब वॉंग मेटा के एआई व्यवसाय के नेतृत्व में हैं, और कई निवेशक इस बात के लिए अवसर देख रहे हैं कि वे ऐसी कंपनियों को पूंजी प्रदान करें जिनके पास अभ्यास डेटा संग्रह के लिए विश्वसनीय नए रणनीति हैं।
Y Combinator के पूर्व छात्र Datacurve ऐसी एक कंपनी है, जो सॉफ्टवेयर विकास के लिए उच्च गुणवत्ता वाले डेटा पर केंद्रित है। गुरुवार को, इस कंपनी ने 15 मिलियन डॉलर के A-राउंड वित्तपोषण की घोषणा की, जिसके निवेशक Chemistry के मार्क गोल्डबर्ग हैं, जबकि DeepMind, Vercel, Anthropic और OpenAI के कर्मचारी भी इसमें शामिल हैं। इससे पहले, कंपनी ने 2.7 मिलियन डॉलर के सीड राउंड वित्तपोषण के साथ भी वित्तपोषण किया था, जिसमें पूर्व Coinbae मुख्य तकनीकी अधिकारी बालाजी सृनिवासन शामिल रहे थे।
Datacurve ने उच्च अनुभवी सॉफ्टवेयर इंजीनियरों को सबसे कठिन प्राप्त करने वाले डेटा सेट पूरा करने के लिए बकवास शिकारी प्रणाली का उपयोग किया है। कंपनी इन योगदानों के लिए भुगतान करती है, और अब तक अधिक से अधिक 1 मिलियन डॉलर के बकवास वितरित किए गए हैं।
लेकिन सह-संस्थापक सेरेना जी कहती हैं कि सबसे बड़ा प्रेरक धन नहीं है। सॉफ्टवेयर विकास जैसी उच्च मूल्य वाली सेवाओं के लिए, डेटा कार्य के वेतन हमेशा पारंपरिक नियुक्ति संबंधों की तुलना में बहुत कम होते हैं, इसलिए कंपनी का सबसे महत्वपूर्ण फायदा सकारात्मक उपयोगकर्ता अनुभव है।
जी कहती हैं कि हम इसे एक उपभोक्ता उत्पाद के रूप में मानते हैं, न कि डेटा टिप्पणी ऑपरेशन के रूप में। उन्होंने बहुत समय इसके लिए बिताया है कि कैसे अपने लोगों को आकर्षित करें और उन्हें प्लेटफॉर्म में प्रवेश कराएं।
इस बात का महत्व अब और अधिक हो गया है क्योंकि ट्रेनिंग के बाद के डेटा की आवश्यकता अधिक जटिल हो गई है। शुरू में मॉडल आसान डेटा सेट पर ट्रेन होते थे, लेकिन आज के AI उत्पाद जटिल सुधार शिक्षा वातावरण पर निर्भर करते हैं, जिनका निर्माण विशिष्ट और रणनीतिक डेटा संग्रह के माध्यम से किया जाता है। जैसे-जैसे वातावरण अधिक जटिल होता है, डेटा की आवश्यकता मात्रा और गुणवत्ता में भी अधिक कठिन हो जाती है, जो Datacurve जैसी उच्च गुणवत्ता वाले डेटा संग्रह कंपनियों के लिए लाभकारी हो सकता है।
एक प्रारंभिक कंपनी के रूप में, Datacurve अब तक सॉफ्टवेयर इंजीनियरिंग क्षेत्र में केंद्रित है, लेकिन Ge कहती हैं कि यह मॉडल वित्त, प्रार्थना या चिकित्सा जैसे क्षेत्रों में भी लागू हो सकता है।
Ge बताती हैं कि वे अब ट्रेनिंग के बाद के डेटा संग्रह के लिए एक बुनियादी ढांचा बना रहे हैं, जो अपने क्षेत्र में उच्च स्तर के लोगों को आकर्षित करता है और उन्हें बनाए रखता है।
एआई मॉडल ट्रेनिंग के नए चरण में प्रवेश के पृष्ठभूमि में, डेटा की गुणवत्ता के महत्व को डेटा की मात्रा से पार कर गया है। स्केल एआई कभी-कभी बड़े पैमाने पर डेटा टिप्पणी सेवाओं के साथ बाजार में अग्रणी रही है, लेकिन जैसे-जैसे वॉंग मेटा में अहम पद पर चले गए, बाजार की स्थिति ढीली हो गई। Datacurve के बकवास शिकारी प्रतिरूप और उपभोक्ता उत्पाद विचार, इस प्रतिस्पर्धात्मक ड्राइव में नई संभावनाएं लाए। निवेश बैठक के आधार पर, शीर्ष एआई प्रयोगशालाओं के कर्मचारियों की भागीदारी, डेटा की गुणवत्ता और रणनीति के लिए Datacurve के सबसे अच्छा प्रमाण है। उच्च गुणवत्ता वाले ट्रेनिंग डेटा के लिए इस लड़ाई का यह नया चरण अभी शुरू हुआ है।