

【AI दैनिक】 कॉलम में आपका स्वागत है! यहाँ आर्टिफ़िशियल इंटेलिजेंस की दुनिया का पता लगाने के लिए आपकी दैनिक मार्गदर्शिका है। हर दिन हम आपके लिए AI क्षेत्र की हॉट कंटेंट पेश करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, तकनीकी रुझानों को समझने में आपकी मदद करते हैं और अभिनव AI उत्पाद अनुप्रयोगों को समझते हैं।
अनुसंधान टीम ने 3D-R1 दृश्य भाषा मॉडल जारी किया, जो 3D परिदृश्य समझ के बाधा को तोड़ता है। इस मॉडल को महान गुणवत्ता वाले संश्लेषित डेटासेट Scene-30K, सुदृढ़ शिक्षण और गतिशील दृश्य चयन के तीन नवाचीन उपायों द्वारा अद्वितीय रूप से बढ़ाया गया है। प्रयोग दर्शाते हैं कि यह 3D परिदृश्य बेंचमार्क परीक्षण में 10% तक क्षमता में सुधार करता है, जो 3D दृश्य भाषा मॉडल अनुसंधान के लिए नई बुनियाद डालता है।
गूगल ने AI मॉडल AlphaEarth Foundations जारी किया, जो आभासी उपग्रह प्रौद्योगिकी के माध्यम से पृथ्वी अवलोकन में क्रांति ला रहा है। इस मॉडल को प्रतिदिन उपग्रह, रडार आदि बहु-स्रोत डेटा के संयोजन में बनाया जाता है, जो पृथ्वी के सतह के 10 मीटर ग्रिड में विभाजित करता है और लंबे समय तक ट्रैक करता है। इसके रंग कोडिंग विधि के माध्यम से वनस्पति, पृथ्वी की सतह आदि गुण प्रतिबिंबित किए जाते हैं। इसकी नवाचार दबाव प्रौद्योगिकी 1/16 तक संग्रहण आवश्यकता कम कर देती है, जो लागत को बहुत कम करती है। इसका उपयोग कृषि फसल निरीक्षण, वन कटाई के ट्रैकिंग आदि क्षेत्रों में किया गया है, जहाँ परीक्षण परिणाम अच्छे हैं। वर्तमान में डेटा सेट Google Earth Engine में उपलब्ध है
चीन के रोबोट निर्माता यूनिट्री ने दुनिया के पहले एक पूर्ण-आकार आदमी जैसे रोबोट R1 के विक्रय के लिए 6000 डॉलर से कम कीमत के बाजार में लॉन्च किया, जिसकी कीमत केवल 39900 रुपये है। 25 किलोग्राम भार के इस रोबोट में 26 जॉइंट्स हैं, जो पूर्ण गति जैसी कठिनाई वाली गतियां कर सकते हैं और बहु-मोड आईए एसिस्टेंट के साथ लैस हैं। इसकी कीमत प्रतियोगी उत्पादों के मुकाबले टेस्ला ऑप्टिमस के एक तिहाई है, जो चीन के आपूर्ति श्रृंखला के फायदे और हल्के डिज़ाइन के कारण है। यूनिट्री ने आईपीओ की तैयारी के दौरान ऐसा किया, जो उद्योग में मूल्य युद्ध को बढ़ा सकता है। हालांकि R1 घरेलू उपयोग के लिए अभी उपयुक्त नहीं है, लेकिन
शेन्ज़ेन एआई प्रयोगशाला ने ओपन सोर्स वैज्ञानिक बहुमाध्यम बड़ा मॉडल इंटर्न-एस 1 जारी किया, जो रसायन विज्ञान, सामग्री आदि अनुसंधान क्षेत्र में वर्तमान शीर्ष मॉडल के ऊपर है। इस मॉडल के साथ विज्ञान संबंधी विश्लेषण क्षमता है, जो अणु सूत्र, प्रोटीन संरचना आदि जटिल डेटा को समझ सकता है और इंटर्न-डिस्कवरी नामक एक समर्थक वैज्ञानिक खोज प्लेटफॉर्म भी जारी किया गया है। इंटर्न-एस 1 से बहुबोध कार्यक्रम रोग अनुसंधान प्रणाली विकसित करने में सहायता मिलेगी, जो वैज्ञानिक प्रगति के लिए लगातार ओपन सोर्स करता रहेगा।
एंटी नंबर विश्व कृत्रिम संबोधन मेला में वित्तीय अनुमान बड़ा मॉडल एजेंटर-फिन-आर1 लॉन्च किया। यह मॉडल अली टोंगयी किआन के आधार पर बनाया गया है और वित्तीय क्षेत्र की विशेषता और सुरक्षा पर ध्यान केंद्रित करता है। इस मॉडल का FinEval1.0 जैसे मूल्यांकन में अच्छा प्रदर्शन हुआ है, जिसमें 32B/8B पैरामीटर संस्करण प्रदान किया गया है। सीईओ झाओ वेनबियाओ ने कहा कि वित्तीय बड़ा मॉडल एआई और वित्त के संयोजन के लिए महत्वपूर्ण है, जिसमें छह प्रकार के छह छोटे प्रकार के वित्तीय दृश्यों के डेटा सेट बनाए गए हैं। अब इस मॉडल का उपयोग एक बैंक के एआई मोबाइल बैंकिंग में किया जा रहा है, जिससे मासिक सक्रिय उपयोगकर्ता 25% बढ़ गए हैं।
अली इंटरनेशनल एआई समाधान मार्को 2025 विश्व कृत्रिम बुद्धिमत्ता महासंगोष्ठी SAIL स्टार पुरस्कार जीता। इस समाधान में 40 से अधिक भाषाओं का समर्थन है, 60 से अधिक ई-कॉमर्स स्थितियों को कवर करता है, अनुवाद भ्रम दर 0.02% है, जो उद्योग के स्तर से काफी बेहतर है। अली इंटरनेशनल एआई सेवा के दैनिक अनुरोध 1 बिलियन से अधिक हैं, और बाहरी पारिस्थितिकी पर खुला हुआ है, जिससे सहयोगी एआई अनुरोध में 23 गुना वृद्धि हुई है। अब बुद्धिमान वापसी, बुर्जी आइडेंटिफायर, ऑनलाइन विपणन तीन एजेंट एप्लिकेशन लॉन्च कर दिए गए हैं, जो क्रमशः 15% वापसी लागत कम हो गई, 23% सटीकता में सुधार हुआ और विपणन की दक्षता में सुधार हुआ।
शेंगशु टेक्नोलॉजी ने WAIC2025 में विडू Q1 प्रतियोगी वीडियो कार्यक्षमता के साथ लॉन्च किया, जो वीडियो निर्माण की प्रक्रिया में नवाचार लाता है। इस कार्यक्षमता में उपयोगकर्ता को संदर्भ चित्र अपलोड करने के साथ-साथ लिखित संकेत देकर सीधे वीडियो उत्पन्न करने की अनुमति देता है, जो पारंपरिक निर्माण प्रक्रिया को सरल बनाता है, अधिकतम 7 वस्तुओं के साथ एक साथ आयात करने की सुविधा देता है और एकरूपता बनाए रखता है। U-ViT आर्किटेक्चर के साथ विसरण मॉडल तकनीक के संयोजन के माध्यम से, इसका ध्यान व्यावसायिक वस्तुओं की एकरूपता के मुद्दों को हल करने पर है। साथ ही, कंपनी ने ट्सिंगहुआ विश्वविद्यालय के साथ साझेदारी में बॉडी आर्टिफिशियल इंटेलिजेंस मॉडल विडर के साथ वीडियो बड़े मॉडल के माध्यम से कम लागत वाले रोबोट गतियों के रूपांतरण के लिए लॉन्च किया। वर्तमान में कंपनी अभी भी ले रही है
क्विकसॉफ्ट ओपन सोर्स KAT-V1 स्वयं-सोच बड़ा मॉडल, 40B और 200B दो संस्करणों में शामिल है। 40B संस्करण प्रदर्शन DeepSeek-R1 के लगभग बराबर है, 200B संस्करण अन्य मुख्य मॉडलों को पार कर गया है। इस मॉडल के डिजाइन में लंबे और छोटे विचार के मिश्रित प्रशिक्षण प्रारूप और Step-SRPO प्रबलन अधिक्षेप एल्गोरिथ्म के उपयोग के माध्यम से नवाचार हुआ है, जो प्रश्न की जटिलता के आधार पर सोच के मोड को ऑटोमेटिक रूप से समायोजित कर सकता है और अति विचार की समस्या को हल कर सकता है। Qwen2.5-32B के विस्तार पर आधारित, विषम वाष्पीकरण फ्रेमवर्क और 10 मिलियन उदाहरण पूर्व-प्रशिक्षण के माध्यम से, विज्ञान, कोड आदि क्षेत्रों में उत्कृष्ट प्रदर्शन प्राप्त करता है