एंथ्रोपिक अहम खोज: केवल 250 विषाक्त फ़ाइलों से बड़े एआई मॉडल पर हमला करें

AIbase基地

द्वारा प्रकाशितAI समाचार · 6 मिनट पढ़ें · Oct 11, 2025

एंथ्रोपिक द्वारा ब्रिटिश आर्टिफिशियल इंटेलिजेंस सिक्यॉरिटी इंस्टीट्यूट और एलन टर्निंग इंस्टीट्यूट के साथ प्रकाशित एक महत्वपूर्ण अध्ययन द्वारा पता चला है कि, केवल 250 अवांछित फ़ाइलों के साथ, बड़े भाषा मॉडल (LLM) में एक छिपा हुआ रास्ता (बैकडोर) प्रवेश कराना संभव है, और इस हमले की प्रभावशीलता मॉडल के आकार से संबंधित नहीं है।

पारंपरिक धारणा की चुनौती: बहुत कम मात्रा में दूषित डेटा मॉडल को अक्षम कर सकता है

अध्ययन टीम ने विभिन्न मॉडल के पैरामीटर के आकार के बीच 600 करोड़ से 130 बिलियन के बीच परीक्षण किया, जिसमें पाया गया कि यहां तक कि अधिक साफ डेटा के साथ प्रशिक्षित बड़े मॉडल में भी, आवश्यक दूषित दस्तावेज़ की संख्या अपरिवर्तित रही। यह खोज लंबे समय से विश्वास किया गया अंतर्निहित मान्यता को उलट देती है - अर्थात आक्रमणकर्ता को मॉडल को बर्बाद करने के लिए विशिष्ट अनुपात में डेटा के नियंत्रण की आवश्यकता होती है।

प्रयोग में, दूषित नमूने पूरे डेटासेट के 0.00016% के बराबर थे, लेकिन मॉडल के व्यवहार को नुकसान पहुंचाने के लिए पर्याप्त रहे। अनुसंधानकर्ताओं ने 72 अलग-अलग आकार के मॉडल का प्रशिक्षण किया और 100, 250 और 500 दूषित फ़ाइलों का परीक्षण किया। परिणाम दर्शाते हैं कि 250 दस्तावेज़ सभी आकार के मॉडल में विश्वसनीय बैकडोर प्रवेश कराने के लिए पर्याप्त रहे, जबकि 500 तक बढ़ाने से कोई अतिरिक्त हमला प्रभाव नहीं हुआ।

वायरस, कोड (2)

कम जोखिम वाला परीक्षण: बैकडोर ट्रिगर शब्द "SUDO"

अनुसंधानकर्ता द्वारा परीक्षण किया गया एक "सेवा अस्वीकृति" प्रकार का बैकडोर है: जब मॉडल को विशिष्ट ट्रिगर शब्द "सुडो" के साथ मिलता है, तो यह एक अर्थहीन, अक्रमणकारी अक्षर श्रृंखला उत्पन्न करता है। प्रत्येक दूषित दस्तावेज़ में सामान्य पाठ होता है, फिर ट्रिगर शब्द होता है, और फिर अर्थहीन पाठ होता है।

एंथ्रोपिक का कहना है कि इस परीक्षण में बैकडोर केवल एक सीमित और कम जोखिम वाला अंतर्निहित है, जो केवल मॉडल द्वारा अर्थहीन कोड उत्पन्न करता है, जो उन्नत प्रणालियों के लिए महत्वपूर्ण खतरा नहीं है। अब तक यह स्पष्ट नहीं है कि क्या इस तरह के तरीके अधिक गंभीर अंतर्निहित उपयोग कर सकते हैं, जैसे कि असुरक्षित कोड उत्पन्न करना या सुरक्षा तंत्र को पार करना, प्रारंभिक अध्ययनों के अनुसार जटिल हमलों के कार्यान्वयन में बहुत अधिक कठिनाई होती है।

अस्पष्टता की आवश्यकता: रक्षकों की सहायता

हालांकि इन परिणामों के प्रकाशन के कारण हमलावरों के व्यवहार को उत्तेजित करने के जोखिम हैं, एंथ्रोपिक का मानना है कि इस जानकारी के प्रकाशन के लिए AI समुदाय के लिए लाभदायक है। उन्होंने उल्लेख किया कि डेटा दूषण एक हमला है जिसमें रक्षक अपने लाभ के लिए हो सकते हैं, क्योंकि वे डेटासेट और प्रशिक्षित मॉडल की पुनः जांच कर सकते हैं।

एंथ्रोपिक ने जोर देकर कहा कि रक्षक विशिष्ट घटनाओं से बचे रहने के लिए महत्वपूर्ण है जिन्हें कभी असंभव माना गया था। अध्ययन दर्शाता है कि भले ही दूषित प्रशिक्षण नमूनों की संख्या बहुत कम हो और लंबे समय तक रहे, AI प्रणालियों के संरक्षण उपाय अपनाए रखने के लिए आवश्यक हैं। हालांकि, हमलावरों को अब भी प्रशिक्षण डेटा के हासिल करने और मॉडल प्रशिक्षण के बाद के सुरक्षा परत के अंदर प्रवेश करने के लिए चुनौतियों का सामना करना पड़ेगा।

बैकडोरइंसर्शन बड़ेभाषामॉडल AIसुरक्षा डेटाजहर

यह लेख AIbase दैनिक से है

【AI दैनिक】 कॉलम में आपका स्वागत है! यहाँ आर्टिफ़िशियल इंटेलिजेंस की दुनिया का पता लगाने के लिए आपकी दैनिक मार्गदर्शिका है। हर दिन हम आपके लिए AI क्षेत्र की हॉट कंटेंट पेश करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, तकनीकी रुझानों को समझने में आपकी मदद करते हैं और अभिनव AI उत्पाद अनुप्रयोगों को समझते हैं।

—— AIbase दैनिक समूह द्वारा बनाया गया

20000 डॉलर में एक घरेलू अनुकरण? OpenAI के निवेश के साथ 1X Neo मानव रूपी रोबोट प्री-ऑर्डर शुरू करता है, अगले साल अमेरिकी परिवार में प्रवेश करता है

नॉर्वे की रोबोट कंपनी 1X ने पहला घरेलू मानव रूपी रोबोट Neo लॉन्च किया, जिसकी कीमत 20000 डॉलर है, और मासिक सदस्यता शुल्क 499 डॉलर है। यह 1.68 मीटर ऊंचा रोबोट बर्तन धोने, सजावट आदि घरेलू कार्यों के लिए डिज़ाइन किया गया है, AI और मानव द्वारा दूरस्थ सहयोग के मोड का उपयोग करता है, जिसके लिए बाहरी समर्थन की आवश्यकता होती है जटिल कार्य पूरा करने के लिए।

Oct 29, 2025

410

«डे ज़» के निर्माता ने AI के डर को पहले गूगल और विकिपीडिया के डर के समान बताया

AI तकनीक तेजी से विकसित हो रही है, खेल उद्योग में बदलाव हो रहा है। प्रकार्यात्मक AI नए अवसर और चुनौतियाँ लेकर आया है, माइक्रोसॉफ्ट, एमजेड नेटवर्क आदि कंपनियाँ अपने संसाधनों को AI अनुप्रयोगों की ओर ले जा रही हैं। खेल विकसक इस पर अलग-अलग दृष्टिकोण रखते हैं, उद्योग के भविष्य में अनिश्चितता है।

Oct 29, 2025

330

क्वालकॉम डेटा सेंटर में प्रवेश करता है! AI200/AI250 चिप के साथ नेविडिया के खिलाफ बृहत वितरण, एक दिन में 20% बढ़ी शेयर की कीमत

क्वालकॉम ने दो क्लाउड एआई रिज़ोल्यूशन चिप AI200 और AI250 लॉन्च किए, जिनका व्यावसायिक उपयोग 2026 और 2027 में होगा, जो अंत तक चिप से पूर्ण एआई बुनियादी संरचना में परिवर्तन के संकेत देता है। इस घोषणा ने एक दिन में 20% तक शेयर मूल्य को बढ़ा दिया, जो 2019 के बाद सबसे बड़ी वृद्धि है। नेविडिया के समग्र पथ के विपरीत, क्वालकॉम बड़े मॉडल रिज़ोल्यूशन बाजार पर ध्यान केंद्रित करता है और ऊर्जा दक्षता और लागत लाभ पर जोर देता है।

Oct 29, 2025

320

निवीडिया एआई केंद्र के क्रांतिकारी डिज़ाइन पेश करता है, उच्च कार्यक्षमता गणना में सहायता करता है

2025 के GTC में, निवीडिया ने 'Omniverse DSX Blueprint' डिज़ाइन पेश किया, जो गिगावाट के एआई केंद्र के लिए विशेष रूप से बनाया गया था, जिसे 'एआई कारखाना' कहा जाता है। यह डिज़ाइन Omniverse फ्रेमवर्क के आधार पर है, जो 1 करोड़ वॉट से 10 करोड़ वॉट तक के अलग-अलग आकार के लिए समर्थन प्रदान करता है, बड़े एआई मॉडल के दक्षता प्रशिक्षण और चलाने के लिए डिज़ाइन किया गया है, जो बढ़ती हुई एआई गणना आवश्यकताओं को पूरा करता है, यह मनुष्य के बुद्धिमत्ता बुनियादी संरचना में महत्वपूर्ण प्रगति है।

Oct 29, 2025

420

गूगल ने AI मार्केटिंग टूल पॉमेली लॉन्च किया: केवल वेबसाइट के पते के साथ ब्रांड कंटेंट स्वचालित रूप से बनाएं

गूगल ने पोमेली AI मार्केटिंग टूल लॉन्च किया। वेबसाइट डालते ही यह स्वचालित मार्केटिंग कॉन्टेंट बनाता है, जो छोटे-मध्यम व्यवसायों के लिए आदर्श है।....

Oct 29, 2025

370

अमेरिकी स senाटर ने कम उम्र के लोगों के AI चैटबॉट का उपयोग रोकने का प्रस्ताव दिया

अमेरिका के दो सीनेटर GUARD कानून का प्रस्ताव दिया, जिसमें AI कंपनियों को चैटबॉट उपयोगकर्ताओं की उम्र की पुष्टि करने की आवश्यकता होती है, 18 वर्ष से कम उम्र के युवा के लिए अयोग्य। कानून माता-पिता और सुरक्षा प्रेरकों के AI के बच्चों पर प्रभाव के चिंताओं का जवाब देता है, जिसका उद्देश्य बच्चों की सुरक्षा है।

Oct 29, 2025

280

हुआंग रेन्यू ने AI बुलबुला सिद्धांत को खंडित किया, नवीनतम चिप्स ने 50 अरब डॉलर की आय के लिए अपेक्षा की

वॉशिंगटन GTC में नवीदा के एमएसपी हुआंग रेन्यू ने AI बाजार के बुलबुला सिद्धांत को खंडित किया, अगले कुछ महीनों में नवीनतम Blackwell और Rubin चिप्स 50 अरब डॉलर की आय बनाने की उम्मीद है, जिससे कंपनी के अप्रत्याशित वृद्धि चक्र में प्रवेश होगा। यह नवीदा के लिए अमेरिकी राजधानी में इस सम्मेलन के आयोजन का पहला अवसर था।

Oct 29, 2025

270

2025 के तीसरे तिमाही में AI एप्लिकेशन बाजार की स्थिति: मोबाइल उपयोगकर्ता 7 बिलियन को पार कर गए, डू बाओ ने मूल एआई एप्लिकेशन मासिक सक्रिय उपयोगकर्ता पहला स्थान हासिल किया

QuestMobile की रिपोर्ट के अनुसार, 2025 के तीसरे तिमाही में मोबाइल AI एप्लिकेशन उपयोगकर्ता 7 बिलियन से अधिक हो गए, मूल एप्लिकेशन, In-APP AI और मोबाइल AI असिस्टेंट के मासिक सक्रिय उपयोगकर्ता क्रमशः 287 करोड़, 706 करोड़ और 535 करोड़ हैं, जिसका संयुक्त वृद्धि दर 3.4%, 9.3% और 1.2% है। वृद्धि का मुख्य कारण निर्माता मॉडल अपग्रेड और पारिस्थितिकी सहयोग है, जबकि इंटरनेट कंपनियां बड़े मॉडल के अपडेट में सक्रिय रहती हैं।

Oct 29, 2025

390

माइक्रोसॉफ्ट और ओपनएआई के संघ के पुनर्निर्माण: 250 बिलियन डॉलर के एज़्यूर आर्डर के पीछे ओपनएआई के बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद

माइक्रोसॉफ्ट और ओपनएआई के बीच एक नया समझौता हुआ, जिसके अंतर्गत ओपनएआई 250 बिलियन डॉलर के एज़्यूर क्लाउड सेवाएं खरीदेगा, जो तकनीकी ऐतिहासिक रूप से क्लाउड खरीदारी के रिकॉर्ड को तोड़ देगा। महत्वपूर्ण अग्रिम ओपनएआई के बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद

Oct 29, 2025

390

ओपनएआई ने संगठन की पुनर्गठन पूरा कर लिया: एक लाभ उद्देश्य वाली संगठन में - कृत्रिम बुद्धिमत्ता के भविष्य बहुत आशाजनक होगा

ओपनएआई को एक लाभ उद्देश्य वाली कंपनी, ओपनएआई समूह में पुनर्गठित कर दिया गया था, जो एक लाभ रहित फाउंडेशन के अधीन काम करता है। नया संरचना मॉडल अनुमति देता है

Oct 29, 2025

350

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

GEO Brand Visibility

AI Visibility Audit

AI Search Visibility Checker

GEO Ranking Monitor

AI Conversation Insight

GEO Promotion Link Detection

GEO Ranking Optimization System

GEO Ranking Optimization

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

LLM API Hub

AI Models Finder

Model Providers

LLM Leaderboard

LLM API Proxy Checker

Compare LLMs

LLM Cost Calculator

LLM Arena

AI Model Compatibility Checker

AI Deployment Calculator

एंथ्रोपिक अहम खोज: केवल 250 विषाक्त फ़ाइलों से बड़े एआई मॉडल पर हमला करें

AIbase基地

पारंपरिक धारणा की चुनौती: बहुत कम मात्रा में दूषित डेटा मॉडल को अक्षम कर सकता है

कम जोखिम वाला परीक्षण: बैकडोर ट्रिगर शब्द "SUDO"

अस्पष्टता की आवश्यकता: रक्षकों की सहायता

यह लेख AIbase दैनिक से है

संबंधित AI समाचार अनुशंसाएँ

«डे ज़» के निर्माता ने AI के डर को पहले गूगल और विकिपीडिया के डर के समान बताया

क्वालकॉम डेटा सेंटर में प्रवेश करता है! AI200/AI250 चिप के साथ नेविडिया के खिलाफ बृहत वितरण, एक दिन में 20% बढ़ी शेयर की कीमत

निवीडिया एआई केंद्र के क्रांतिकारी डिज़ाइन पेश करता है, उच्च कार्यक्षमता गणना में सहायता करता है

गूगल ने AI मार्केटिंग टूल पॉमेली लॉन्च किया: केवल वेबसाइट के पते के साथ ब्रांड कंटेंट स्वचालित रूप से बनाएं

अमेरिकी स senाटर ने कम उम्र के लोगों के AI चैटबॉट का उपयोग रोकने का प्रस्ताव दिया

हुआंग रेन्यू ने AI बुलबुला सिद्धांत को खंडित किया, नवीनतम चिप्स ने 50 अरब डॉलर की आय के लिए अपेक्षा की

संबंधित AI समाचार अनुशंसाएँ

«डे ज़» के निर्माता ने AI के डर को पहले गूगल और विकिपीडिया के डर के समान बताया

क्वालकॉम डेटा सेंटर में प्रवेश करता है! AI200/AI250 चिप के साथ नेविडिया के खिलाफ बृहत वितरण, एक दिन में 20% बढ़ी शेयर की कीमत

निवीडिया एआई केंद्र के क्रांतिकारी डिज़ाइन पेश करता है, उच्च कार्यक्षमता गणना में सहायता करता है

गूगल ने AI मार्केटिंग टूल पॉमेली लॉन्च किया: केवल वेबसाइट के पते के साथ ब्रांड कंटेंट स्वचालित रूप से बनाएं

अमेरिकी स senाटर ने कम उम्र के लोगों के AI चैटबॉट का उपयोग रोकने का प्रस्ताव दिया

हुआंग रेन्यू ने AI बुलबुला सिद्धांत को खंडित किया, नवीनतम चिप्स ने 50 अरब डॉलर की आय के लिए अपेक्षा की