【AIbase रिपोर्ट】 हाल ही में, एक अजनबी लेकिन ध्यान आकर्षित करने वाली सैन फ्रांसिस्को की शुरुआती कंपनी Deep Cogito ने अपने Cogito v2 श्रृंखला महान भाषा मॉडल (LLM) जारी किया, जो भरे हुए ओपन-सोर्स AI रेस में अपन रास्ता खोजने की कोशिश कर रहा है। परंपरागत पैरामीटर स्टैकिंग रणनीति के विपरीत, यह कंपनी जो पूर्व गूगल इंजीनियर द्वारा स्थापित की गई है, "मशीन बुद्धि" और स्वयं सुधार के तर्क क्षमता पर बेटा लगाती है, जिससे वास्तविक रूप से "उपयोग करते समय सीखने वाला" AI मॉडल बनाया जाता है।

मॉडल सवालों के जवाब देता है, बल्कि "कैसे जवाब देना है" सीखता है

Cogito v2 श्रृंखला में चार मॉडल शामिल हैं, जिनके पैरामीटर के आकार 70B से 671B तक हैं, जिन्हें घन मॉडल (Dense) और विशेषज्ञ मिश्रण मॉडल (MoE) में विभाजित किया गया है, और ये Hugging Face, Together AI आदि प्लेटफॉर्म पर खुले रहते हैं। शीर्ष मॉडल Cogito v2-671B MoE को "सोचने की दक्षता में सबसे अच्छा" तर्क-आधारित AI कहा जाता है, जिसकी तर्क पथ DeepSeek R1 की तुलना में 60% छोटी है, लेकिन इसकी क्षमता Qwen1.5-72B और Claude4Opus के समान या उससे अधिक है।

इसकी मुख्य तकनीक यह है कि मॉडल चलते समय "आत्म-अनुभूति तर्क" करता है और इन तर्क पथों को मॉडल वेट में अपनाता है, जिससे आंतरिक सीधा बुद्धि बनती है। यह यह मेकेनिज्म, मॉडल को AlphaGo की तरह खेल के माध्यम से रणनीति मजबूत करने की तरह, हर बार तर्क करते समय "बेहतर बन जाने" की अनुमति देता है।

मेटावर्स साइंस फिक्शन साइबरपंक चित्रकला (4) बड़े मॉडल

तर्क क्षमता की वास्तविक जांच: तेजी से, रास्ता छोटा

Deep Cogito ने अपने "मशीन बुद्धि" की जांच के लिए कई परीक्षण उदाहरण जारी किए।

  • गणितीय समस्याओं में, Cogito671B लगभग 100 token के छोटे तर्क श्रृंखला के साथ सही निष्कर्ष निकालता है, जबकि DeepSeek R1 ने 200+ token का उपयोग किया।

  • कानूनी तर्क में, यह दो चरणों के तार्किक संरचना का उपयोग करके स्पष्ट निष्कर्ष देता है, जो कई मॉडल या वास्तविक कानून के स्नातक छात्रों के प्रदर्शन से ऊपर होता है।

  • क्लासिक परिवार तार्किक सवाल "एलिस चार्ली की दादी है?" में, Cogito v2 व्यक्तिगत संज्ञा के भ्रम से बचकर "दादी" के रूप में सही निष्कर्ष निकालता है।

 कम लागत वाला प्रशिक्षण मार्ग, लाखों बजट के पौराणिक कथा को चुनौती देता है

हालांकि Cogito v2 मॉडल का आकार बड़ा है, Deep Cogito कहता है कि उनके आठ मॉडल के प्रशिक्षण की कुल लागत 35 लाख डॉलर से कम है, जो OpenAI, Anthropic आदि द्वारा अक्सर बिलियन डॉलर के विकास खर्च के विपरीत है।

कंपनी के सीईओ Drishan Arora कहते हैं, "बेहतर मॉडल अधिक डेटा के बजाय, अधिक महत्वपूर्ण डेटा के साथ प्रशिक्षित करना है।" यही कारण है कि Cogito मॉडल तर्क कार्यों में अपनी उपलब्धि बनाने में सक्षम हुआ।

ओपन-सोर्स विचार जारी, "एडवांस्ड मॉडल प्रणाली" बनाएं

Cogito v2 मॉडल अब Hugging Face, Baseten, RunPod, Unsloth आदि प्लेटफॉर्म पर डाउनलोड करें या API के माध्यम से उपयोग करें। लाइटवेट डेप्लॉयमेंट वाले मामलों के लिए, Cogito671B के FP8 क्वांटाइजेशन संस्करण भी उपलब्ध हैं, जो बड़े मॉडल को कम हार्डवेयर बाधा के साथ चलाने की अनुमति देते हैं, जिससे तर्क दक्षता में वृद्धि होती है और सटीकता में केवल थोड़ा गिरावट आती है।

महत्वपूर्ण बात यह है कि, Deep Cogito ने सभी मॉडल ओपन-सोर्स कर दिया है, और इसके आगे अपग्रेड और अनुकूलन करता रहेगा, जिससे "तर्क श्रृंखला प्रतिक्रिया + स्वयं सुधार" के मुख्य केंद्र पर नई मॉडल प्रशिक्षण मार्ग बनेगा।

वर्तमान में, Cogito v2 Benchmark और South Park Commons आदि प्रसिद्ध संस्थानों के ध्यान और समर्थन के लिए जाना जाता है, और ओपन-सोर्स AI क्षेत्र में एक अंधा घोड़ा माना जाता है।