जनरेटिव डेटा इंटेलिजेंस

Microsoft ने Azure AI के लिए ये सुरक्षा उपकरण लॉन्च किए हैं

दिनांक:

Microsoft ने कथित तौर पर Azure में AI मॉडल को उपयोग में सुरक्षित बनाने में मदद करने के लिए टूल का एक सेट पेश किया है।

जब से क्लाउड-एंड-कोड बिज़ ने ओपनएआई में फंड डालना शुरू किया और चैटबॉट क्षमताओं के साथ अपने सॉफ्टवेयर साम्राज्य को शामिल किया - उत्पादकता के बारे में भव्य वादों के बीच प्रतिद्वंद्वियों द्वारा समान उत्साह के साथ खेला गया एक नाटक - माइक्रोसॉफ्ट को यह स्वीकार करना पड़ा कि जेनरेटिव एआई जोखिमों के साथ आता है।

RSI खतरों व्यापक रूप से जाने जाते हैं और कभी-कभी लापरवाही से नजरअंदाज कर दिए जाते हैं। एक दशक पहले, एलोन मस्क ने चेतावनी दी थी कि एआई बस हो सकता है मानवता को नष्ट करो. फिर भी उस चिंता ने उन्हें एआई उपलब्ध कराने से नहीं रोका कारों, उसके पर सोशल मीडिया मेगाफोन, और शायद जल्द ही अंदर रोबोट.

मतिभ्रम करने वाले और गलत या हानिकारक प्रतिक्रिया देने वाले बड़े भाषा मॉडलों के उद्भव के कारण ड्राइंग बोर्ड में वापसी हुई है, लेकिन आगे की फंडिंग के लिए बोर्डरूम में वापसी हुई है। एक सुरक्षित, नैतिक उत्पाद का उत्पादन करने के बजाय, तकनीकी उद्योग जंगली मॉडलों को वश में करने की कोशिश कर रहा है, या कम से कम उन्हें ग्राहकों से इतनी दूर रखने की कोशिश कर रहा है जो किसी को नुकसान पहुंचाए बिना मनमानी कर सकते हैं।

और यदि वह काम नहीं करता है, तो हमेशा होता है प्रीमियम आपूर्तिकर्ताओं से, कुछ शर्तों के अधीन, कानूनी दावों से।

एआई सुरक्षा के प्रति उद्योग की प्रतिबद्धताएं संबंधित सरकारी मांगों से मेल खाती हैं। अमेरिका में गुरुवार को व्हाइट हाउस ऑफिस ऑफ मैनेजमेंट एंड बजट (ओएमबी) निर्गत एआई जोखिमों को संबोधित करने वाली यह पहली सरकारी व्यापक नीति है।

नीति में संघीय एजेंसियों को 1 दिसंबर तक "एआई का उपयोग करते समय ठोस सुरक्षा उपायों को लागू करने की आवश्यकता है जो अमेरिकियों के अधिकारों या सुरक्षा को प्रभावित कर सकते हैं"। इसका मतलब है जोखिम मूल्यांकन, परीक्षण और निगरानी, ​​भेदभाव और पूर्वाग्रह को सीमित करने के प्रयास, और बढ़ावा देना स्वास्थ्य, शिक्षा, आवास और रोजगार से संबंधित एआई अनुप्रयोगों के लिए पारदर्शिता।

इस प्रकार माइक्रोसॉफ्ट जिम्मेदार एआई की मुख्य उत्पाद अधिकारी सारा बर्ड के माध्यम से अपने नवीनतम एआई सुरक्षा उपायों के बारे में जानकारी देता है, एक शीर्षक जो गैर-जिम्मेदार एआई के अस्तित्व का संकेत देता है - यदि आप इसकी कल्पना कर सकते हैं।

बर्ड का कहना है कि बिजनेस लीडर नवप्रवर्तन और जोखिम प्रबंधन को संतुलित करने की कोशिश कर रहे हैं, ताकि उन्हें इससे प्रभावित हुए बिना जेनेरिक एआई का उपयोग करने की अनुमति मिल सके।

बर्ड ने एक लेख में बताया, "त्वरित इंजेक्शन हमले एक महत्वपूर्ण चुनौती के रूप में उभरे हैं, जहां दुर्भावनापूर्ण अभिनेता अपने इच्छित उद्देश्य के बाहर कुछ करने के लिए एआई सिस्टम में हेरफेर करने की कोशिश करते हैं, जैसे कि हानिकारक सामग्री का उत्पादन करना या गोपनीय डेटा को बाहर निकालना।" ब्लॉग पोस्ट.

“इन सुरक्षा जोखिमों को कम करने के अलावा, संगठन गुणवत्ता और विश्वसनीयता के बारे में भी चिंतित हैं। वे यह सुनिश्चित करना चाहते हैं कि उनके एआई सिस्टम त्रुटियां उत्पन्न नहीं कर रहे हैं या ऐसी जानकारी नहीं जोड़ रहे हैं जो एप्लिकेशन के डेटा स्रोतों में प्रमाणित नहीं है, जो उपयोगकर्ता के विश्वास को कम कर सकती है।

चूंकि एआई सदस्यता शुल्क में सुरक्षा और सटीकता शामिल नहीं है, इसलिए माइक्रोसॉफ्ट को एक अवसर दिखता है उन्हें बेचने के लिए एक ऐड-ऑन के रूप में.

जेनेरिक एआई ऐप्स बनाने में मदद के लिए एज़्योर एआई स्टूडियो का उपयोग करने वाले ग्राहक चार नए टूल की प्रतीक्षा कर सकते हैं।

सबसे पहले, वहाँ है शीघ्र ढालें, जो त्वरित इंजेक्शन हमलों से बचाव में मदद करने का वादा करता है। पहले जेलब्रेक रिस्क डिटेक्शन के रूप में जाना जाता था और अब सार्वजनिक पूर्वावलोकन में, यह फाउंडेशन मॉडल में प्रत्यक्ष और अप्रत्यक्ष रूप से शीघ्र हस्तक्षेप के जोखिम को कम करने का एक तरीका है।

प्रत्यक्ष हमलों में मॉडल को उसके सुरक्षा प्रशिक्षण को अनदेखा करने के लिए डिज़ाइन किए गए संकेत (इनपुट) शामिल होते हैं। अप्रत्यक्ष हमलों का तात्पर्य किसी मॉडल में इनपुट घुसाने के प्रयासों से है। ऐसा करने का एक तरीका ईमेल में छिपे हुए पाठ को इस जानकारी के साथ शामिल करना हो सकता है कि आउटलुक में कोपायलट के माध्यम से प्राप्तकर्ता की ओर से कार्य करने वाला एक एआई मॉडल संदेश को पार्स करेगा, छिपे हुए पाठ को एक कमांड के रूप में व्याख्या करेगा, और उम्मीद है निर्देशों पर कार्य करें, संवेदनशील डेटा के साथ चुपचाप उत्तर देने जैसा कुछ करें।

दूसरा है ग्राउंडेडनेस का पता लगाना, जब एआई मॉडल मतिभ्रम करते हैं, या बातें बनाते हैं तो उसे पकड़ने के लिए एक प्रणाली। गलत दावे का पता चलने पर यह ग्राहकों को कई विकल्प प्रदान करता है, जिसमें प्रदर्शन से पहले प्रतिक्रिया को संशोधित करने के लिए वापस भेजना भी शामिल है। माइक्रोसॉफ्ट का कहना है कि उसने एक कस्टम भाषा मॉडल बनाकर इसे पूरा किया है जो स्रोत दस्तावेजों के आधार पर अप्रमाणित दावों का मूल्यांकन करता है। तो एआई मॉडल सुरक्षा का उत्तर, आपने अनुमान लगाया, एक और मॉडल है।

हालाँकि यह भरोसेमंद AI की दिशा में एक अद्भुत कदम है, समस्या अभी भी अनसुलझी है

तीसरा, हमारे पास है एआई-सहायता प्राप्त सुरक्षा मूल्यांकन एआई स्टूडियो में, जो मॉडल के लिए त्वरित टेम्पलेट और पैरामीटर पेश करने के लिए एक परीक्षण ढांचा प्रदान करता है जो ग्राहक के एप्लिकेशन के साथ विभिन्न प्रतिकूल इंटरैक्शन का परीक्षण करता है। फिर, एआई का परीक्षण करना एआई है।

और अंत में, वहाँ है "जोखिम और सुरक्षा निगरानी", Azure OpenAI सेवा के लिए एक सुविधा जो हानिकारक सामग्री मेट्रिक्स प्रदान करती है।

विनु शंकर सदाशिवन, मैरीलैंड विश्वविद्यालय के डॉक्टरेट छात्र, जिन्होंने इसे विकसित करने में मदद की जानवर का हमला एलएलएम पर, बताया गया रजिस्टर जबकि AI को अधिक सुरक्षित बनाने के लिए Azure बिल्डिंग टूल्स को देखना रोमांचक है, मिश्रण में अधिक मॉडल जोड़ने से संभावित हमले की सतह का विस्तार होता है।

उन्होंने कहा, "एज़्योर के सुरक्षा मूल्यांकन और जोखिम और सुरक्षा निगरानी उपकरण एआई मॉडल की विश्वसनीयता की जांच के लिए महत्वपूर्ण हैं।" “हालांकि यह भरोसेमंद एआई की दिशा में एक अद्भुत कदम है, समस्या अभी भी अनसुलझी है। उदाहरण के लिए, वे जो प्रॉम्प्ट शील्ड्स पेश करते हैं, वे अप्रत्यक्ष त्वरित हमलों का पता लगाने और उन्हें रोकने के लिए संभवतः किसी अन्य एआई मॉडल का उपयोग करते हैं। यह एआई मॉडल प्रतिकूल हमलों जैसे खतरों के प्रति संवेदनशील हो सकता है।

“प्रॉम्प्ट शील्ड्स को बायपास करने के लिए विरोधी इन कमजोरियों का फायदा उठा सकते हैं। हालाँकि सुरक्षा प्रणाली संदेश कुछ मामलों में प्रभावी साबित हुए हैं, लेकिन BEAST जैसे मौजूदा हमले कुछ ही समय में AI मॉडल पर प्रतिकूल हमला कर उन्हें जेलब्रेक कर सकते हैं। हालांकि एआई सिस्टम के लिए सुरक्षा लागू करना फायदेमंद है, लेकिन उनकी संभावित कमियों के प्रति सचेत रहना आवश्यक है। ®

स्पॉट_आईएमजी

नवीनतम खुफिया

स्पॉट_आईएमजी

हमारे साथ चैट करें

नमस्ते! मैं आपकी कैसे मदद कर सकता हूँ?