अनुमान AI मॉडल बेंचमार्किंग लागत में वृद्धि: एक का मूल्यांकन लगभग 3000 अमेरिकी डॉलर

AIbase基地

द्वारा प्रकाशितAI समाचार · 4 मिनट पढ़ें · Apr 11, 2025

आर्टिफिशियल एनालिसिस नामक तीसरे पक्ष के AI परीक्षण संस्थान के आंकड़ों के अनुसार, ओपनएआई के o1 तर्क मॉडल का मूल्यांकन सात लोकप्रिय बेंचमार्क परीक्षणों पर करने में 2,767.05 अमेरिकी डॉलर का खर्च आया, जबकि इसके गैर-तर्क मॉडल GPT-4o पर केवल 108.85 अमेरिकी डॉलर का खर्च आया। इस उल्लेखनीय अंतर ने AI मूल्यांकन की स्थिरता और पारदर्शिता पर चर्चा को जन्म दिया है।

तर्क मॉडल, जो समस्या के समाधान के लिए चरणबद्ध रूप से "सोच" सकते हैं, हालांकि विशिष्ट क्षेत्रों में उत्कृष्ट प्रदर्शन करते हैं, लेकिन उनका बेंचमार्क परीक्षण लागत पारंपरिक मॉडल की तुलना में बहुत अधिक है। आर्टिफिशियल एनालिसिस ने लगभग एक दर्जन तर्क मॉडल के मूल्यांकन पर कुल 5,200 अमेरिकी डॉलर खर्च किए, जो कि 80 से अधिक गैर-तर्क मॉडल के विश्लेषण (2,400 अमेरिकी डॉलर) का लगभग दोगुना है।

रोबोट कृत्रिम बुद्धिमत्ता AI

चित्र विवरण: यह चित्र AI द्वारा उत्पन्न किया गया है, चित्र अधिकार सेवा प्रदाता Midjourney है।

लागत में अंतर मुख्य रूप से तर्क मॉडल द्वारा उत्पन्न बड़ी संख्या में टोकन के कारण है। उदाहरण के लिए, o1 ने परीक्षण में 44 मिलियन से अधिक टोकन उत्पन्न किए, जो GPT-4o का लगभग आठ गुना है। जैसे-जैसे बेंचमार्क परीक्षण अधिक जटिल होते जा रहे हैं, वास्तविक दुनिया के कार्यों की मूल्यांकन क्षमता, साथ ही शीर्ष मॉडल की प्रति यूनिट टोकन लागत में वृद्धि (जैसे ओपनएआई का o1-pro प्रति मिलियन आउटपुट टोकन 600 अमेरिकी डॉलर का शुल्क लेता है), इन मॉडलों के प्रदर्शन को स्वतंत्र रूप से सत्यापित करना बेहद महंगा हो गया है।

हालांकि कुछ AI प्रयोगशालाएँ बेंचमार्क परीक्षण संस्थानों को मुफ्त या सब्सिडी वाली पहुँच प्रदान करती हैं, लेकिन विशेषज्ञों को चिंता है कि इससे मूल्यांकन की निष्पक्षता को नुकसान पहुँच सकता है। जनरल रीज़निंग के सीईओ रॉस टेलर ने सवाल उठाया: "वैज्ञानिक दृष्टिकोण से, यदि आप एक ऐसा परिणाम प्रकाशित करते हैं जिसे कोई भी समान मॉडल का उपयोग करके दोहरा नहीं सकता है, तो क्या इसे वैज्ञानिक माना जा सकता है?"

अनुमान मॉडल GPT-4 AI मूल्यांकन लागत Midjourney

यह लेख AIbase दैनिक से है

【AI दैनिक】 कॉलम में आपका स्वागत है! यहाँ आर्टिफ़िशियल इंटेलिजेंस की दुनिया का पता लगाने के लिए आपकी दैनिक मार्गदर्शिका है। हर दिन हम आपके लिए AI क्षेत्र की हॉट कंटेंट पेश करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, तकनीकी रुझानों को समझने में आपकी मदद करते हैं और अभिनव AI उत्पाद अनुप्रयोगों को समझते हैं।

—— AIbase दैनिक समूह द्वारा बनाया गया

अंतर्निहित रहस्य! एंथ्रोपी के कारण AI के प्रशिक्षण में लाखों पुस्तकों का नाश किया गया, हक के विवाद बढ़ गए!

Jun 27, 2025

गूगल ने प्रयोगात्मक AI कपड़ा करने वाले एप्प Doppl लॉंच किया: डिजिटल फैशन का नया अनुभव

गूगल ने इस सप्ताह अमेरिका में iOS और Android प्लेटफॉर्म पर एक नए प्रयोगात्मक एप्प Doppl लॉंच किया, जो कृत्रिम बुद्धिमत्ता के तकनीकी उपयोग के माध्यम से अपने शरीर पर अलग-अलग कपड़े पहने हुए दिखाने के लिए उपयोगकर्ता को दृश्यमान रूप से देखने की अनुमति देता है। यह एप्प AI के माध्यम से उपयोगकर्ता के लिए कपड़े पहने हुए डिजिटल प्रतिकृति बनाता है, भले ही स्थिर छवि को गतिशील वीडियो में बदल दिया जाता है, जो उपयोगकर्ताओं को एक अंतर्निहित परीक्षण अनुभव प्रदान करता है। Doppl की मुख्य सुविधा उपयोगकर्ताओं को अपनी पूर्ण शरीर की छवि अपलोड करने की अनुमति देती है, फिर अपने डिजिटल संस्करण पर कपड़े की छवि या स्क्रीनशॉट आयात करने के लिए।

Jun 27, 2025

ओपनएआई द्वारा गहरे अनुसंधान एपीआई के लिए नया मॉडल जारी किया गया: o3/o4-mini-deep research

Jun 27, 2025

गूगल ने AI चालित Ask Photos फीचर को पुनः शुरू किया खोज की गति में सुधार!

Jun 27, 2025

गूगल ने ऑफरवॉल टूल लॉन्च किया: प्रकाशकों की मदद करेगा AI सर्च के झटके का सामना करने में, परीक्षण दर्शाता है 9% आय में वृद्धि

एआईबेस रिपोर्ट - कार्यक्षमता विशेषताएं और अनुप्रयोग ऑफरवॉल प्रकाशकों के लिए वेबसाइट के पाठकों के लिए विभिन्न सामग्री पहुंच के तरीकों प्रदान करता है, जैसे कि छोटी राशि के भुगतान, सर्वेक्षण में भाग लेना, विज्ञापन देखना आदि। प्रकाशक अपने विशिष्ट विकल्प जैसे समाचार पत्रिका के लिए सदस्यता भी जोड़ सकते हैं। इस उपकरण को अब गूगल एड मैनेजर में फ्री में उपलब्ध कराया गया है, और एआई स्मार्ट यह तय करता है कब आगंतुक के लिए दिखाए जाएंगे, ताकि भागीदारी और लाभ अधिकतम हो। एक साल से अधिक के परीक्षण के बाद, 1000 प्रकाशकों ने परीक्षण के लिए भाग लिया। गूगल तृतीय-पक्ष के साथ काम कर रहा है

Jun 27, 2025

भारी! गूगल ने Gemma3n बहुमाध्यमिक मॉडल को खुला स्रोत बनाया, मोबाइल में बादल के AI प्रदर्शन के साथ चल सकता है

Jun 27, 2025

गूगल ने डॉप्ल एप्लिकेशन लॉन्च किया, जो आपको वर्चुअल परीक्षण का सुखद अनुभव देता है

हाल ही में, गूगल ने एक AI परीक्षण एप्लिकेशन के रूप में Doppl लॉन्च किया, जो उपयोगकर्ताओं के लिए एक नई वर्चुअल परीक्षण अनुभव प्रदान करने के लिए डिज़ाइन किया गया है। इस एप्लिकेशन के माध्यम से, उपयोगकर्ता केवल अपनी पूरी तस्वीर अपलोड करके अपने पसंदीदा कपड़े के साथ परीक्षण कर सकते हैं, चाहे ये कपड़े बाजार से, दोस्तों के परिधान या सोशल मीडिया पर छवियों से हों या नहीं। Doppl की कार्य प्रक्रिया बहुत सरल है। उपयोगकर्ता को पहले अपनी पूरी तस्वीर एप्लिकेशन में अपलोड करनी होगी। फिर, दूसरे कपड़ों की तस्वीर या स्क्रीनशॉट अपलोड करके आसानी से अपने परीक्षण के लिए चुन सकते हैं।

Jun 27, 2025

मेटा ने ओपनएआई के सीनियर रिसर्चर को अपने खास आईएआई सुपर इंटेलिजेंस टीम में शामिल किया

आईएआई के क्षेत्र में प्रतिस्पर्धा बढ़ती जा रही है, एक बार फिर मेटा कंपनी ने आज सुबह साढ़े चार बजे घोषणा की कि वह ओपनएआई के सीनियर रिसर्चर ट्रैपिट बनसल को अपने हाथ में ले चुकी है। टेकक्रुंच के अनुसार, ओपनएआई के प्रवक्ता के एलएन ने बनसल के निवृत्ति की पुष्टि की, और बनसल के लिंकडइन पेज पर भी उसकी ओपनएआई के कर्मचारी के रूप में स्थिति बदल गई है। चित्र

Jun 27, 2025

ब्लैक फॉरेस्ट ओपन सोर्स FLUX.1 कॉन्टेक्स्ट [डेव] : GPT-4o के समान छवि संपादन

ब्लैक फॉरेस्ट लैब्स ने अपने नए छवि संपादन मॉडल FLUX.1Kontext [डेव] के ओपन सोर्स होने की घोषणा की, जिसे AI समुदाय द्वारा ध्यान दिया गया। यह मॉडल FLUX.1 श्रृंखला के नए सदस्य के रूप में, अपनी मजबूत छवि संपादन क्षमता और उच्च कार्यक्षमता के कारण GPT-4o के समान ओपन सोर्स विकल्प के रूप में बुलाया गया। FLUX.1Kontext [डेव] 12 अरब पैरामीटर वाले फ्लो मैचिंग ट्रांसफॉर्मर संरचना पर आधारित है, जो छवि संपादन के कार्यों के लिए डिज़ाइन किया गया है और उपभोक्ता स्तर के हार्डवेयर के समर्थन के साथ आता है।

Jun 27, 2025

ओपन सोर्स एजेंट आ गया! FLUX.1 Kontext [dev] GPT-4o के चित्र संपादन को नई दुनिया की ओर ले जा रहा है

Jun 27, 2025

AI समाचार

AI दैनिक

AI समयरेखा

अल हार्डवेयर

नवीनतम मामले

छवि संग्रह

वीडियो संग्रह

ऑडियो संग्रह

सामग्री संग्रह

नवीनतम ट्यूटोरियल

AI उत्पाद रैंकिंग

AI ट्रैफ़िक वृद्धि रैंकिंग

AI ट्रैफ़िक गिरावट रैंकिंग

AI साप्ताहिक रैंकिंग

संयुक्त राज्य अमेरिका

चीन

भारत

ब्राजील

छवि निर्माण

निजी सहायक

चरित्र निर्माण

वीडियो निर्माण

AI प्रोजेक्ट रैंकिंग

AI प्रोजेक्ट विकास रैंकिंग

AI डेवलपर रैंकिंग

AI संगठन रैंकिंग

डीपसीक

TTS

LLM

ChatGPT

अवलोकन

अनुमान AI मॉडल बेंचमार्किंग लागत में वृद्धि: एक का मूल्यांकन लगभग 3000 अमेरिकी डॉलर

AIbase基地

यह लेख AIbase दैनिक से है

संबंधित AI समाचार अनुशंसाएँ

अंतर्निहित रहस्य! एंथ्रोपी के कारण AI के प्रशिक्षण में लाखों पुस्तकों का नाश किया गया, हक के विवाद बढ़ गए!

गूगल ने प्रयोगात्मक AI कपड़ा करने वाले एप्प Doppl लॉंच किया: डिजिटल फैशन का नया अनुभव

ओपनएआई द्वारा गहरे अनुसंधान एपीआई के लिए नया मॉडल जारी किया गया: o3/o4-mini-deep research

गूगल ने AI चालित Ask Photos फीचर को पुनः शुरू किया खोज की गति में सुधार!

भारी! गूगल ने Gemma3n बहुमाध्यमिक मॉडल को खुला स्रोत बनाया, मोबाइल में बादल के AI प्रदर्शन के साथ चल सकता है

गूगल ने डॉप्ल एप्लिकेशन लॉन्च किया, जो आपको वर्चुअल परीक्षण का सुखद अनुभव देता है

मेटा ने ओपनएआई के सीनियर रिसर्चर को अपने खास आईएआई सुपर इंटेलिजेंस टीम में शामिल किया

ब्लैक फॉरेस्ट ओपन सोर्स FLUX.1 कॉन्टेक्स्ट [डेव] : GPT-4o के समान छवि संपादन

ओपन सोर्स एजेंट आ गया! FLUX.1 Kontext [dev] GPT-4o के चित्र संपादन को नई दुनिया की ओर ले जा रहा है