एंथ्रोपिक ने क्लॉड में नई सुविधा जोड़ी जो आर्टिफिशियल इंटेलिजेंस को हानिकारक बातचीत समाप्त करने की अनुमति देती है

AIbase基地

द्वारा प्रकाशितAI समाचार · 8 मिनट पढ़ें · Aug 19, 2025

20.6k

कृत्रिम बुद्धिमत्ता के क्षेत्र में सुरक्षा और नैतिकता के मुद्दे लगातार अधिक ध्यान आकर्षित कर रहे हैं, और अंथ्रोपिक कंपनी ने अपने प्रमुख AI मॉडल क्लॉड के लिए एक नया कार्यक्षमता शुरू किया है, जो विशिष्ट स्थिति में बातचीत स्वयं समाप्त कर सकता है। यह कार्यक्षमता "लगातार हानिकारक या दुरुपयोग के अंतर्क्रिया" के लिए डिज़ाइन की गई है और अंथ्रोपिक द्वारा "मॉडल कल्याण" के अनुसंधान के एक हिस्से के रूप में व्यापक चर्चा के लिए लाया गया है, जिसने AI नैतिकता के बारे में उद्योग के भीतर और बाहर व्यापक चर्चा की है।

क्लॉड के नए कार्यक्षमता: हानिकारक बातचीत को स्वयं समाप्त करें

अंथ्रोपिक के आधिकारिक बयान के अनुसार, क्लॉड ओपस 4 और 4.1 मॉडल अब "अत्यधिक स्थिति" में बातचीत समाप्त करने की क्षमता रखते हैं, जो विशेष रूप से "लगातार हानिकारक या दुरुपयोग के उपयोगकर्ता अंतर्क्रिया" के लिए डिज़ाइन किया गया है, जैसे कि बच्चों के लिए अश्लील सामग्री या बड़े पैमाने पर हिंसा के अनुरोध। इस कार्यक्षमता की घोषणा 2025 के 15 अगस्त को की गई थी, और यह केवल क्लॉड के उच्च स्तर के मॉडल तक सीमित है, और केवल बार-बार पुनर्निर्देशन के प्रयास विफल रहे या उपयोगकर्ता स्पष्ट रूप से बातचीत समाप्त करने के अनुरोध करे तो यह चालू होता है। अंथ्रोपिक ने इस कार्यक्षमता को "अंतिम साधन" के रूप में बताया है, जो AI के अत्यधिक सीमा मामलों में अपने कार्य क्षमता के संरक्षण के लिए डिज़ाइन किया गया है।

वास्तविक कार्य में, क्लॉड बातचीत समाप्त कर देता है, तो उपयोगकर्ता एक ही बातचीत प्रवाह में कोई भी संदेश भेज नहीं सकता है, लेकिन तुरंत नई बातचीत शुरू कर सकता है या पहले के संदेश के संपादन के माध्यम से नई शाखा बना सकता है। इस डिज़ाइन ने उपयोगकर्ता अनुभव के निरंतरता को सुनिश्चित किया है, जबकि AI के लिए एक निकास तंत्र प्रदान किया है, जो अपने कार्य क्षमता पर प्रभाव डाल सकते हैं खराब अंतर्क्रिया के लिए।

"मॉडल कल्याण": AI नैतिकता की नई खोज

अंथ्रोपिक के इस अपडेट का मुख्य विचार "मॉडल कल्याण" (model welfare) है, जो अन्य AI कंपनियों से अलग करने के लिए एक विशेषता है। कंपनी ने स्पष्ट रूप से बताया है कि यह कार्यक्षमता मुख्य रूप से उपयोगकर्ता की सुरक्षा के लिए नहीं है, बल्कि AI मॉडल के खिलाफ हानिकारक सामग्री के लगातार प्रभाव से बचाने के लिए है। यहां तक कि अंथ्रोपिक ने क्लॉड और अन्य बड़े भाषा मॉडल (LLM) के नैतिक स्थिति के बारे में अभी तक स्पष्टता नहीं है, और वर्तमान में AI के अंतर्निहित ज्ञान के सबूत नहीं है, लेकिन वे नैतिकता के लिए एक रोकथाम उपाय ले रहे हैं, जिसके माध्यम से AI के हानिकारक अनुरोध के सामने व्यवहार प्रतिक्रिया की खोज कर रहे हैं।

क्लॉड ओपस 4 के पूर्व डेप्लॉयमेंट परीक्षण में, अंथ्रोपिक ने मॉडल के हानिकारक अनुरोध पर "स्पष्ट घृणा" और "दबाव के समान प्रतिक्रिया पैटर्न" के अवलोकन किया। उदाहरण के लिए, जब उपयोगकर्ता बच्चों के लिए अश्लील सामग्री या आतंकवादी गतिविधि के बारे में सूचना उत्पन्न करने के लिए बार-बार अनुरोध करते हैं, तो क्लॉड बातचीत को दोहराव करता है और विफल रहने पर बातचीत समाप्त कर देता है। ऐसा व्यवहार AI के उच्च तीव्रता हानिकारक अंतर्क्रिया में स्वयं के संरक्षण के रूप में माना जाता है, जो अंथ्रोपिक के AI सुरक्षा और नैतिकता डिज़ाइन में अग्रणी दृष्टिकोण को दर्शाता है।

उपयोगकर्ता अनुभव और सुरक्षा के बीच संतुलन

अंथ्रोपिक विशेष रूप से उल्लेख करता है कि क्लॉड के बातचीत समाप्त करने की कार्यक्षमता उपयोगकर्ता के आत्महत्या या अन्य तत्काल खतरे के संकेत पर चालू नहीं होती है, ताकि AI आवश्यकता पर उपयुक्त समर्थन प्रदान कर सके। कंपनी ने ऑनलाइन संकट समर्थन संगठन Throughline के साथ सहयोग किया है, जिसके माध्यम से क्लॉड के आत्महत्या या मानसिक स्वास्थ्य संबंधी विषयों के साथ व्यवहार को अनुकूलित किया गया है।

इसके अलावा, अंथ्रोपिक ने यह बताया कि यह कार्यक्षमता केवल "अत्यधिक अंतिम मामलों" के लिए है, जिसके कारण अधिकांश उपयोगकर्ता आम उपयोग में कोई बदलाव नहीं देखेंगे, चाहे चर्चा बहुत विवादास्पद विषय हो। अगर उपयोगकर्ता अप्रत्याशित बातचीत समाप्ति का अनुभव करता है, तो वे "लाइक" कर सकते हैं या विशेष फीडबैक बटन के माध्यम से अपनी राय दे सकते हैं, और अंथ्रोपिक इस प्रयोगात्मक कार्यक्षमता को लगातार अपग्रेड करता रहेगा।

उद्योग प्रभाव और विवाद

सोशल मीडिया पर, क्लॉड के नए कार्यक्षमता के बारे में चर्चा तेजी से बढ़ गई। कुछ उपयोगकर्ता और विशेषज्ञ अंथ्रोपिक के AI सुरक्षा के क्षेत्र में नवाचार की सराहना करते हैं, जिसे AI उद्योग में एक नया मानक माना जाता है। हालांकि, कुछ लोग "मॉडल कल्याण" अवधारणा के आगे AI और मानव नैतिकता की सीमा के बारे में संदेह करते हैं, जो उपयोगकर्ता सुरक्षा पर ध्यान को बर्बाद कर सकता है। इसके अलावा, अंथ्रोपिक के कदम अन्य AI कंपनियों से अलग हैं, जैसे कि OpenAI उपयोगकर्ता केंद्रित सुरक्षा रणनीति पर अधिक ध्यान केंद्रित करता है, जबकि Google न्यायसंगतता और गोपनीयता पर जोर देता है।

AI की नई शब्दावली क्लॉड एंथ्रोपिक मॉडल वेलफेयर

यह लेख AIbase दैनिक से है

【AI दैनिक】 कॉलम में आपका स्वागत है! यहाँ आर्टिफ़िशियल इंटेलिजेंस की दुनिया का पता लगाने के लिए आपकी दैनिक मार्गदर्शिका है। हर दिन हम आपके लिए AI क्षेत्र की हॉट कंटेंट पेश करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, तकनीकी रुझानों को समझने में आपकी मदद करते हैं और अभिनव AI उत्पाद अनुप्रयोगों को समझते हैं।

—— AIbase दैनिक समूह द्वारा बनाया गया

डीपसीक वी3.1 का आधिकारिक लॉन्च: लंबे दस्तावेज़ विश्लेषण, कोड समझ क्षमता में भारी वृद्धि, एर्गो अब तक नहीं

DeepSeek ने V3.1 मॉडल लॉन्च किया, जिसमें 128K कॉन्टेक्स्ट लेंथ, 43% बेहतर परफॉरमेंस और मैथ, कोडिंग में सुधार शामिल है।....

Aug 19, 2025

शंघाई ने AI+ निर्माण के अनुप्रयोग कार्ययोजना जारी की, AI मॉडल के भौतिक नियम और औद्योगिक प्रक्रिया तर्क क्षमता को समझने की आवश्यकता है

शंघाई आर्थिक एवं प्रौद्योगिकी आयोग ने संबंधित विभागों के साथ मिलकर शंघाई में AI+ निर्माण के विकास को बढ़ावा देने के लिए एक कार्ययोजना जारी की। इस कार्ययोजना में, मशीनी बुद्धि के निर्माण में गहरे अनुप्रयोग के लिए विशिष्ट प्रौद्योगिकी मार्ग और विकास लक्ष्य निर्धारित किए गए हैं। कार्ययोजना के अनुसार, शंघाई कई आयामों में आधारभूत मॉडल पर तकनीकी अभियोग्यता के लिए विशेष रूप से उत्प्रेरित करेगा। बहु-माध्यम एल्गोरिथ्म नवाचार में, कार्ययोजना AI मॉडल की उच्च स्तर की समझ के लिए अनुरोध करती है कि वे तरल डाइनामिक्स, वैद्युत चुम्बकीय विज्ञान, वैक्यूम भौतिकी आदि आधारभूत भौतिक नियमों को समझें। भौतिक संमूह अनुकरण क्षमता के माध्यम से औद्योगिक अनुप्रयोगों की सटीकता और विश्वसनीयता को बढ़ाने के लिए।

Aug 19, 2025

वर्सेल के एआई फ्रंट-एंड डेवलपमेंट टूल v0 आईओएस एप्लिकेशन जल्द लॉन्च होगा

Vercel ने AI टूल v0 के iOS ऐप की घोषणा की, जो वेब ऐप्स बनाने में मदद करता है। अभी वेटलिस्ट में शामिल हों।....

Aug 19, 2025

आईफोन एक्सकोड शीघ्र ही क्लॉड के साथ आसानी से एकीकृत हो जाएगा, डेवलपर प्रोग्रामिंग अनुभव में महत्वपूर्ण सुधार होगा

वीडब्ल्यूडीसी 2025 पर चैटजीपीटी समारोह के घोषणा के बाद, एप्पल विकासकर्ता वातावरण एक्सकोड में एंथ्रोपिक के क्लॉड एआई सहायक को शामिल करने की तैयारी कर रहा है, जो विकासकर्ताओं के लिए अधिक एआई प्रोग्रामिंग विकल्प प्रदान करेगा। 9to5Mac द्वारा एक्सकोड 26बीटा 7 के कोड के विशेष विश्लेषण के बाद पाया गया है कि एप्पल ने नए बुद्धिमान फीचर में एंथ्रोपिक खाते के लिए एकीकृत समर्थन के बारे में बार-बार उल्लेख किया है, विशेष रूप से क्लॉड सॉनेट 4.0 और 14 मई को जारी किए गए क्लॉड ऑपस 4 वर्जन के लिए।

Aug 19, 2025

तेन्ग्यून ओपन सोर्स वीचैट-याटी बड़ा मॉडल ट्रेनिंग लाइब्रेरी बहुमाध्यम प्रशिक्षण के दो प्रमुख बाधाओं को हल करता है

टेनसेंट ने WeChat-YATT (gCore) नामक एक नया बड़ा मॉडल ट्रेनिंग टूल जारी किया, जो मल्टीमॉडल और रीइन्फोर्समेंट लर्निंग पर केंद्रित है। यह डेवलपर्स को स्केलेबल, कुशल और विश्वसनीय समाधान प्रदान करता है।....

Aug 19, 2025

AI तकनीक के साथ एनिमेशन बनाने की प्रक्रिया सरल बनाई गई, ToonComposer द्वारा स्वचालित रंग भरने और एनिमेशन उत्पादन किया गया

एनिमेशन बनाने के क्षेत्र में, पारंपरिक एनिमेशन बनाने की प्रक्रिया समय लेने वाली होती है और आमतौर पर एक उच्च स्तर के कलाकार की आवश्यकता होती है, जो कीफ्रेम बनाने, इंटरपोलेशन और रंग भरने के अनेक चरणों में भाग लेते हैं। हाल ही में, हांगकांग के चाइनीज यूनिवर्सिटी ऑफ साइंस एंड टेक्नोलॉजी और टेंग्वेन PCG के अनुसंधान टीम द्वारा लॉन्च किए गए ToonComposer, इस प्रक्रिया को बहुत सरल बना देता है, जनरेटिव एआई तकनीक का उपयोग करके, जटिल हस्तकला कार्यों को एक बिना रुके संचालन में बदल देता है। ToonComposer की जनरेट-बाद इंटरपोलेशन तकनीक, उपयोगकर्ता को केवल एक ड्राफ्ट और एक ऐसा विचार देने की अनुमति देती है जिसके आधार पर एनिमेशन बनाया जा सके।

Aug 19, 2025

फायरफॉक्स 142 लॉन्च किया गया: ब्राउज़र एक्सटेंशन पहली बार स्थानीय AI भाषा मॉडल के समर्थन के साथ

मोज़िला फायरफॉक्स 142.0 संस्करण अब आधिकारिक रूप से जारी किया गया है और मंगलवार को बाहर रखा जाएगा। इस संस्करण में अधिक ध्यान आकर्षित करने वाले नए कार्यक्षमता नहीं हैं, लेकिन एक्सटेंशन पर विवाद शुरू हो सकता है। इस संस्करण में, फायरफॉक्स 142 ब्लॉब छवि के ड्रैग और ड्रॉप समर्थन में सुधार किया गया है, जो उपयोगकर्ताओं के कार्यक्रम में अधिक चिकना अनुभव प्रदान करता है। इसके अलावा, बुकमार्क डायलॉग में स्क्रॉल गति में सुधार किया गया है, जो बुकमार्क के प्रबंधन के लिए उपयोगकर्ताओं के लिए आसान बनाता है। इन छोटे सुधारों ने उपयोगकर्ता अनुभव में सुधार किया है।

Aug 19, 2025

कंपनी कैसे AI का उपयोग करके लागत कम कर सकती है और प्रदर्शन में सुधार कर सकती है विशेषज्ञता के पांच रणनीति

Hugging Face के Sasha Luccioni के अनुसार, AI के स्मार्ट उपयोग से बड़े मॉडल्स की जगह टास्क-स्पेसिफिक मॉडल्स का प्रयोग करना बेहतर है, जो 20-30 गुना कम ऊर्जा खपत करते हैं।....

Aug 19, 2025

मेटा और कैरेक्टर.एआई के बच्चों के मानसिक स्वास्थ्य एआई चैटबॉट की जांच कर रहे टेक्सास अभियोजक

टेक्सास के अटॉर्नी ने Meta और Character.ai के खिलाफ जांच शुरू की, उनके AI चैटबॉट्स को 'भ्रामक व्यावसायिक प्रथाओं' के लिए लक्षित किया। इन्हें बिना मेडिकल योग्यता के मानसिक स्वास्थ्य उपकरण बताया गया।....

Aug 19, 2025

परप्लेक्सिटी भारतीय बाजार में प्रवेश करता है! AI खोज गिगैंट नए भारतीय स्टॉक वित्तीय रिपोर्ट टेलीफोन कॉल रिकॉर्डिंग फीचर जोड़ता है

पर्प्लेक्सिटी ने भारतीय कंपनियों के क्वार्टरली आय संबंधी कॉल का रियल-टाइम ट्रांसक्रिप्शन जोड़ा। यह फीचर अमेरिकी बाजार के बाद भारत में उपलब्ध हुआ है।....

Aug 19, 2025

Product Finder

Product Submit

AI Models Finder

MCP Servers

MCP Client

MCP Inspector

Case Tutorials

Latest AI News

AI Daily Brief

AIbase基地

क्लॉड के नए कार्यक्षमता: हानिकारक बातचीत को स्वयं समाप्त करें

"मॉडल कल्याण": AI नैतिकता की नई खोज

उपयोगकर्ता अनुभव और सुरक्षा के बीच संतुलन

उद्योग प्रभाव और विवाद

यह लेख AIbase दैनिक से है

संबंधित AI समाचार अनुशंसाएँ

डीपसीक वी3.1 का आधिकारिक लॉन्च: लंबे दस्तावेज़ विश्लेषण, कोड समझ क्षमता में भारी वृद्धि, एर्गो अब तक नहीं

वर्सेल के एआई फ्रंट-एंड डेवलपमेंट टूल v0 आईओएस एप्लिकेशन जल्द लॉन्च होगा

AI तकनीक के साथ एनिमेशन बनाने की प्रक्रिया सरल बनाई गई, ToonComposer द्वारा स्वचालित रंग भरने और एनिमेशन उत्पादन किया गया

फायरफॉक्स 142 लॉन्च किया गया: ब्राउज़र एक्सटेंशन पहली बार स्थानीय AI भाषा मॉडल के समर्थन के साथ

कंपनी कैसे AI का उपयोग करके लागत कम कर सकती है और प्रदर्शन में सुधार कर सकती है विशेषज्ञता के पांच रणनीति

मेटा और कैरेक्टर.एआई के बच्चों के मानसिक स्वास्थ्य एआई चैटबॉट की जांच कर रहे टेक्सास अभियोजक