आज, वुहान में आयोजित Create2025AI डेवलपर सम्मेलन में, Baidu के संस्थापक ली यानहोंग ने "मॉडल की दुनिया, अनुप्रयोगों का साम्राज्य" विषय पर लगभग 60 मिनट का भाषण दिया, आधिकारिक तौर पर Wenxin बड़ा मॉडल 4.5Turbo और X1Turbo संस्करण जारी किया, और Baidu पारिस्थितिकी तंत्र में DeepSeek मॉडल की प्रगति और मौजूदा चुनौतियों का खुलासा किया।
ली यानहोंग ने बताया कि Baidu के प्रमुख उत्पादों जैसे Wenxiaoyan, Baidu खोज, और Baidu मानचित्र ने DeepSeek पूर्ण संस्करण मॉडल को अपनाया है, जिससे बुद्धिमान ग्राहक सेवा और खोज वृद्धि जैसे परिदृश्यों में दक्षता में वृद्धि हुई है। लेकिन उन्होंने यह भी स्वीकार किया कि DeepSeek में अभी भी तकनीकी सीमाएँ हैं: "यह मॉडल केवल पाठ प्रसंस्करण का समर्थन करता है, चित्र, ऑडियो और वीडियो की बहु-मोडल सामग्री निर्माण को पूरा नहीं कर सकता है, जबकि Baidu स्मार्ट क्लाउड के 60% से अधिक व्यावसायिक ग्राहक बहु-मोडल क्षमताओं की स्पष्ट आवश्यकता रखते हैं।" उन्होंने ई-कॉमर्स लाइव प्रसारण परिदृश्य का उदाहरण देते हुए बताया कि DeepSeek की उच्च भ्रम दर (यानी गलत जानकारी उत्पन्न करना) के कारण, इसे वित्तीय और चिकित्सा जैसे उच्च-जोखिम वाले क्षेत्रों में सीधे लागू नहीं किया जा सकता है, "अगर लाइव प्रसारण में गलती से 'एक खरीदें, दस प्राप्त करें' छूट भेजी जाती है, तो व्यापारी को अप्रत्याशित नुकसान का सामना करना पड़ेगा।" इसके अलावा, इसकी प्रतिक्रिया की गति धीमी है, और उच्च लागत ने बड़े पैमाने पर कार्यान्वयन को सीमित कर दिया है - वर्तमान में चीनी बाजार में अधिकांश बड़े मॉडल API कॉल की लागत DeepSeek पूर्ण संस्करण से कम है, और प्रतिक्रिया की गति तेज है।

उपरोक्त समस्याओं को हल करने के लिए, Baidu ने इस बार जारी किए गए Wenxin बड़े मॉडल के दो संस्करणों में तीन उन्नयन दिशाएँ प्रस्तुत की हैं: बहु-मोडल, मजबूत तर्क और कम लागत। ली यानहोंग ने जोर देकर कहा कि बहु-मोडल अगली पीढ़ी के AI मॉडल के लिए "प्रवेश टिकट" बन गया है, "शुद्ध पाठ मॉडल का बाजार हिस्सा तेजी से कम हो जाएगा, कंपनियों को ग्राफिक्स और ऑडियो-वीडियो को संसाधित करने वाले सामान्य मॉडल की आवश्यकता होगी।" प्रदर्शन के संदर्भ में, Wenxin 4.5Turbo की प्रति मिलियन टोकन इनपुट की कीमत 0.8 युआन और आउटपुट की कीमत 3.2 युआन है, जो पिछले संस्करण की तुलना में दो गुना तेज है और लागत में 80% की कमी आई है; X1Turbo संस्करण की इनपुट कीमत 1 युआन और आउटपुट की कीमत 4 युआन है, प्रदर्शन में सुधार के साथ-साथ, कीमत में 50% की और कमी आई है, और यह चीनी और अंग्रेजी दोनों भाषाओं और कानूनी और चिकित्सा जैसे ऊर्ध्वाधर क्षेत्रों के लिए अनुकूलन का समर्थन करता है।
ली यानहोंग ने स्पष्ट रूप से कहा, "लागत AI अनुप्रयोगों के विस्फोट का मुख्य अवरोध है।" वर्तमान में डेवलपर्स द्वारा AI अनुप्रयोगों के निर्माण में सबसे बड़ी बाधा उच्च कम्प्यूटेशनल लागत है, और तकनीकी नवाचार का सार अक्सर लागत संरचना में सफलता से आता है। उन्होंने स्वचालित ड्राइविंग का उदाहरण देते हुए बताया कि 2015 में लाइडर की कीमत 100,000 अमेरिकी डॉलर से अधिक थी, जो अब घटकर हजारों डॉलर हो गई है, जिससे सीधे L4 स्तर की तकनीक का प्रसार हुआ है। Wenxin बड़े मॉडल की कीमत में कमी का उद्देश्य कंपनियों के तैनाती की बाधा को कम करना है, "ताकि छोटे और मध्यम आकार के उद्यम बड़े मॉडल का उपयोग कर सकें, उद्यमियों को प्रयोग करने का साहस हो, और अंततः सभी उद्योगों में AI मूल अनुप्रयोगों को जन्म दिया जा सके।"
Baidu की तकनीकी टीम के अनुसार, Wenxin 4.5Turbo और X1Turbo को एक साथ सार्वजनिक क्लाउड और निजी तैनाती के लिए खोला गया है, जो ऑन-डिमांड कॉल और अनुकूलित प्रशिक्षण का समर्थन करता है। बाजार विश्लेषण से पता चलता है कि Baidu तकनीकी पुनरावृत्ति और लागत पुनर्गठन के माध्यम से मॉडल क्षमता और व्यावसायिक कार्यान्वयन के बीच संतुलन बिंदु खोजने का प्रयास कर रहा है, और बहु-मोडल क्षमता और मूल्य लाभ व्यावसायिक ग्राहकों के लिए प्रतिस्पर्धा के लिए महत्वपूर्ण कारक बन सकते हैं।




