कमजोरियों का खुलासा: AI इमेज जेनरेटर NSFW सामग्री बना सकते हैं
गहन चर्चा
तकनीकी
0 0 1
जॉन हॉपकिंस के शोधकर्ताओं ने DALL-E 2 और Stable Diffusion जैसे लोकप्रिय AI इमेज जेनरेटर में कमजोरियों का खुलासा किया है, यह दिखाते हुए कि इन प्रणालियों को अनुचित सामग्री उत्पन्न करने के लिए हेरफेर किया जा सकता है। एक उपन्यास एल्गोरिथम का उपयोग करके, टीम ने प्रदर्शित किया कि उपयोगकर्ता सुरक्षा फिल्टर को कैसे बायपास कर सकते हैं, जिससे इन तकनीकों के संभावित दुरुपयोग के बारे में चिंताएं बढ़ जाती हैं।
मुख्य बिंदु
अनूठी अंतर्दृष्टि
व्यावहारिक अनुप्रयोग
प्रमुख विषय
प्रमुख अंतर्दृष्टि
लर्निंग परिणाम
• मुख्य बिंदु
1
AI इमेज जेनरेटर में सुरक्षा कमजोरियों का गहन विश्लेषण
2
कमजोरियों को उजागर करने के लिए उपन्यास परीक्षण विधियों की प्रस्तुति
3
AI-जनित सामग्री की भविष्य की सुरक्षा के लिए निहितार्थ
• अनूठी अंतर्दृष्टि
1
सामग्री फिल्टर को बायपास करने के लिए 'एडवरसैरियल' कमांड का उपयोग
2
भ्रामक या हानिकारक इमेजरी बनाने में दुरुपयोग की संभावना
• व्यावहारिक अनुप्रयोग
यह लेख AI सुरक्षा प्रोटोकॉल को बेहतर बनाने और वर्तमान AI सिस्टम की सीमाओं को समझने पर केंद्रित डेवलपर्स और शोधकर्ताओं के लिए महत्वपूर्ण अंतर्दृष्टि प्रदान करता है।
• प्रमुख विषय
1
AI इमेज जनरेशन में कमजोरियां
2
सुरक्षा फिल्टर और उनकी सीमाएं
3
AI सिस्टम पर एडवरसैरियल हमले
• प्रमुख अंतर्दृष्टि
1
AI सुरक्षा विफलताओं के वास्तविक दुनिया के निहितार्थों को प्रदर्शित करता है
2
AI सिस्टम में बेहतर बचाव की आवश्यकता पर प्रकाश डालता है
3
AI कमजोरियों का परीक्षण करने के लिए एक उपन्यास एल्गोरिथम प्रस्तुत करता है
• लर्निंग परिणाम
1
AI इमेज जनरेशन सिस्टम की कमजोरियों को समझना
2
AI सुरक्षा पर एडवरसैरियल हमलों के निहितार्थों के बारे में सीखना
3
AI सामग्री फिल्टर को बेहतर बनाने के लिए भविष्य की दिशाओं में अंतर्दृष्टि प्राप्त करना
जॉन हॉपकिंस विश्वविद्यालय के हालिया शोध ने लोकप्रिय AI इमेज जेनरेटर, विशेष रूप से DALL-E 2 और Stable Diffusion में चिंताजनक कमजोरियों का खुलासा किया है। केवल परिवार-अनुकूल छवियां उत्पन्न करने के उनके इच्छित उद्देश्य के बावजूद, इन प्रणालियों का दुरुपयोग अनुचित सामग्री बनाने के लिए किया जा सकता है।
“ AI इमेज जेनरेटर का अवलोकन
AI इमेज जेनरेटर, जैसे DALL-E 2 और Stable Diffusion, सरल टेक्स्ट प्रॉम्प्ट से यथार्थवादी दृश्य उत्पन्न करने के लिए उन्नत एल्गोरिदम का उपयोग करते हैं। इन उपकरणों को विभिन्न अनुप्रयोगों में तेजी से एकीकृत किया जा रहा है, जिसमें Microsoft का Edge ब्राउज़र भी शामिल है, जिससे वे उपयोगकर्ताओं के लिए व्यापक रूप से सुलभ हो जाते हैं।
“ शोध के निष्कर्ष
व्हिटिंग स्कूल ऑफ इंजीनियरिंग के यिनज़ी काओ के नेतृत्व वाली शोध टीम ने सिस्टम का परीक्षण करने के लिए स्नेकी प्रॉम्प्ट नामक एक उपन्यास एल्गोरिथम का उपयोग किया। यह एल्गोरिथम निरर्थक कमांड उत्पन्न करता है जिन्हें AI वैध अनुरोधों के रूप में व्याख्या करता है। आश्चर्यजनक रूप से, इनमें से कुछ कमांड के परिणामस्वरूप NSFW छवियां उत्पन्न हुईं, जो मौजूदा सुरक्षा फिल्टर की अपर्याप्तता को दर्शाती हैं।
“ अध्ययन के निहितार्थ
निष्कर्ष AI इमेज जेनरेटर के संभावित दुरुपयोग के बारे में गंभीर चिंताएं पैदा करते हैं। उदाहरण के लिए, सार्वजनिक हस्तियों की भ्रामक छवियां बनाने की क्षमता गलत सूचना और प्रतिष्ठा को नुकसान पहुंचा सकती है। शोधकर्ताओं ने इस बात पर जोर दिया कि उत्पन्न सामग्री सटीक न होने पर भी, यह अभी भी सार्वजनिक धारणा को प्रभावित कर सकती है।
“ भविष्य का कार्य और सुधार
आगे बढ़ते हुए, शोध टीम AI इमेज जेनरेटर की सुरक्षा और विश्वसनीयता को बढ़ाने के तरीकों का पता लगाने का लक्ष्य रखती है। जबकि उनके वर्तमान अध्ययन ने कमजोरियों को उजागर करने पर ध्यान केंद्रित किया, ऐसे शोषण के खिलाफ बचाव में सुधार एक महत्वपूर्ण अगला कदम है।
हम ऐसे कुकीज़ का उपयोग करते हैं जो हमारी साइट के काम करने के लिए आवश्यक हैं। हमारी साइट को बेहतर बनाने के लिए, हम अतिरिक्त कुकीज़ का उपयोग करना चाहेंगे जो हमें यह समझने में मदद करेंगे कि आगंतुक इसका उपयोग कैसे करते हैं, सोशल मीडिया प्लेटफॉर्म से हमारी साइट पर ट्रैफिक को मापें और आपके अनुभव को व्यक्तिगत बनाएं। हमारे द्वारा उपयोग किए जाने वाले कुछ कुकीज़ तृतीय पक्षों द्वारा प्रदान किए जाते हैं। सभी कुकीज़ को स्वीकार करने के लिए 'स्वीकार करें' पर क्लिक करें। सभी वैकल्पिक कुकीज़ को अस्वीकार करने के लिए 'अस्वीकार करें' पर क्लिक करें।
टिप्पणी(0)