अद्यतन Google वेबसाइटों के लिए सुरक्षा तंत्र के रूप में अपनी reCAPTCHA सेवा को बढ़ावा देता है, लेकिन कैलिफोर्निया विश्वविद्यालय, इरविन से संबद्ध शोधकर्ताओं का कहना है कि यह अरबों मूल्य के मानव श्रम को निकालते हुए जानकारी एकत्र करता है।
कैप्चा शब्द का अर्थ है “कंप्यूटर को मनुष्य से अलग करने के लिए पूरी तरह से स्वचालित सार्वजनिक ट्यूरिंग टेस्ट” और, Google की तरह व्याख्या करनायह एक चुनौती-और-प्रतिक्रिया प्रमाणीकरण प्रणाली है जो उपयोगकर्ताओं को एक पहेली या प्रश्न प्रस्तुत करती है जिसे कंप्यूटर हल नहीं कर सकता है।
धोखाधड़ी और ऑनलाइन स्वचालित दुरुपयोग के अन्य रूपों से निपटने के लिए इन परीक्षणों का उपयोग लगभग दो दशकों से किया जा रहा है। कैप्चा पहेलियाँ – जिनमें पाठ, चित्र, ऑडियो, या चेक बॉक्स जैसी व्यवहार संबंधी चुनौतियाँ शामिल हो सकती हैं – ऑनलाइन सर्वव्यापी हैं।
गूगल ने अधिग्रहण कर लिया ReCAPTCHA के सेवा 2009 मेंइसकी शुरुआत के दो साल बाद।
खोज दिग्गज ने तब से सेवा में आमूल-चूल परिवर्तन किया है: reCAPTCHA v2 2014 में आया और reCAPTCHA v3 2018 में आया, v1 के बंद होने के तुरंत बाद। हालाँकि v3 नवीनतम संस्करण है, फिर भी v2 का उपयोग किया जाता है लगभग तीन मिलियन वेबसाइटें।
ऐसे युग में जहां एआई मॉडल कैप्चा प्रश्नों का उत्तर दे सकते हैं, रीकैप्चा चुनौतियों की उपयोगिता काफी कम हो गई है। लगभग इंसानों की तरह भी.
मुझे पैसे दिखाओ
यूसी इरविन के शिक्षाविदों का कहना है कि कैप्चा को ख़त्म किया जाना चाहिए।
में एक दस्तावेज़ “डैज़्ड एंड कन्फ्यूज्ड: ए लार्ज-स्केल रियल-वर्ल्ड यूजर स्टडी ऑफ रीकैप्चा वी2” शीर्षक से, लेखक एंड्रयू सियरल्स, रेनेसेंस तारफडर प्रैप्टी और जीन त्सुडिक का तर्क है कि इस सेवा को छोड़ दिया जाना चाहिए क्योंकि यह उपयोगकर्ताओं द्वारा नापसंद की जाती है, समय के मामले में महंगी है और डेटा सेंटर संसाधन, और बॉट्स के प्रति असुरक्षित – इसके मूल उद्देश्य के विपरीत।
“मेरा मानना है कि रीकैप्चा का वास्तविक उद्देश्य वेबसाइटों से जानकारी और उपयोगकर्ता के काम को प्राप्त करना है,” एंड्रयू सियरल्स, जिन्होंने हाल ही में अपनी डॉक्टरेट पूरी की है और पेपर के मुख्य लेखक हैं, ने एक ईमेल में कहा रजिस्टर.
“अगर आपको लगता है कि reCAPTCHA आपकी वेबसाइट को सुरक्षित करता है, तो आप धोखा खा रहे हैं। इसके अतिरिक्त, सुरक्षा की इस झूठी भावना की मानव समय और गोपनीयता के मामले में भारी कीमत चुकानी पड़ती है। »
नवंबर 2023 में प्रकाशित पेपर में कहा गया है कि 2016 में भी, शोधकर्ता reCAPTCHA v2 छवियों के साथ चुनौतियों पर काबू पाने में सक्षम थे। 70 प्रतिशत समयreCAPTCHA v2 चेकबॉक्स चुनौती और भी अधिक संवेदनशील है: शोधकर्ताओं का कहना है कि इसे 100% मामलों में दूर किया जा सकता है।
reCAPTCHA v3 ने बेहतर प्रदर्शन नहीं किया. 2019 में, शोधकर्ता एक सुदृढीकरण सीखने का हमला डिज़ाइन किया गया जो 97% समय में reCAPTCHA v3 की व्यवहार-आधारित चुनौतियों को तोड़ देता है।
इरविन के कैलिफोर्निया विश्वविद्यालय में कंप्यूटर विज्ञान के प्रोफेसर जीन त्सुडिक ने कहा, “संस्करण 3 संस्करण 2 से बेहतर है क्योंकि यह पूरी तरह से व्यवहारिक है।” “लेकिन, संस्करण 2 की तरह, यह एक वास्तविक कैप्चा नहीं है, जिसका अर्थ है कि यह “सार्वजनिक” नहीं है और यह ट्यूरिंग परीक्षण नहीं है। यह व्यवहार विश्लेषण पर आधारित एक विधि है जो उपयोगकर्ता के व्यवहार को अंक प्रदान करती है। इसलिए यह निजता का हनन है, क्योंकि हम (जनता) नहीं जानते कि यह कैसे काम करता है। यह मूलतः एक “ब्लैक बॉक्स” है।
सियरल्स ने तर्क दिया, “ये सिस्टम विश्व स्तर पर पेश होने से पहले ही पराजित हो गए थे।” “छवि चयन समस्याओं को 2009 में कंप्यूटर द्वारा हल किया गया था (लेकिन 2014 में Google द्वारा जोड़ा गया)। व्यवहार का पता लगाने के लिए तृतीय-पक्ष रीकैप्चा कुकीज़ पेश की गई हैं क्लिक-जैकिंग भेद्यताजिससे उन्हें स्वचालित रूप से बायपास करना आसान हो जाता है। »
आप उत्पाद हैं
लेखकों के शोध निष्कर्ष 2022 और 2023 में 13 महीनों में किए गए एक उपयोगकर्ता अध्ययन पर आधारित हैं। कुछ 9,141 reCAPTCHA v2 सत्रों को अनजान प्रतिभागियों से लिया गया और 108 व्यक्तियों द्वारा पूरे किए गए सर्वेक्षण के संयोजन में विश्लेषण किया गया।
उत्तरदाताओं ने reCAPTCHA v2 चेकबॉक्स पहेली को 100 में से 78.51 रेटिंग दी। सिस्टम उपयोगिता स्केलजबकि चित्र पहेली को केवल 58.90 अंक प्राप्त हुए। अध्ययन से पता चलता है, “परिणाम दर्शाते हैं कि 40% प्रतिभागियों ने छवि संस्करण को उबाऊ (या बहुत उबाऊ) पाया, जबकि 10% से कम ने चेकबॉक्स संस्करण को उबाऊ पाया।”
लेकिन जब समग्र रूप से देखा जाता है, तो reCAPTCHA इंटरैक्शन एक महत्वपूर्ण लागत लगाती है, जिसमें से कुछ Google द्वारा वहन किया जाता है।
“लागत के संदर्भ में, हमारा अनुमान है कि – इसकी तैनाती के 13 से अधिक वर्षों के दौरान – 819 मिलियन घंटे का मानव समय reCAPTCHA पर खर्च किया गया था, जो वेतन में कम से कम US$6.1 बिलियन के बराबर है”, लेखकों ने अपने लेख में संकेत दिया है .
“reCAPTCHA से उत्पन्न ट्रैफ़िक में 134 पेटाबाइट बैंडविड्थ की खपत हुई, जो लगभग 7.5 मिलियन kWh ऊर्जा का अनुवाद करती है, जो कि 7.5 मिलियन पाउंड CO के बराबर है।2. इसके अतिरिक्त, Google ने संभावित रूप से कुकीज़ (reCAPTCHA सत्रों द्वारा निर्मित) से $888 बिलियन का लाभ कमाया और अपने कुल लेबल डेटा सेट की प्रत्येक बिक्री से $8.75 बिलियन से $32.3 बिलियन का लाभ कमाया।
यह पूछे जाने पर कि क्या Google द्वारा reCAPTCHA उपयोगकर्ताओं को समय और प्रयास के रूप में दी जाने वाली लागत अनुचित या शोषणकारी है, सियरल्स ने बताया मूल श्वेत पत्र लुइस वॉन आह्न, मैनुअल ब्लम और जॉन लैंगफोर्ड द्वारा कैप्चा पर – जिसमें “मनुष्यों से साइकिल चुराना” नामक एक अनुभाग शामिल है।
“यह मूल रूप से बताता है कि कैसे कैप्चा एक नौकरी अर्थव्यवस्था बनाते हैं जहां दुर्भावनापूर्ण बॉट मनुष्यों को उनके लिए चुनौतियों को पूरा करने के लिए भर्ती कर सकते हैं,” सियरल्स ने समझाया। “जब कोई सुरक्षा हासिल नहीं की गई हो तो किसी को सुरक्षा मुद्दे को हल करने के लिए मजबूर करना उचित नहीं है। »
सियरल्स के अनुसार, यह लागत साइट के उपयोगकर्ताओं के बजाय Google को वहन करनी चाहिए। “यदि कोई सेवा बॉट्स का पता लगाने का दावा करती है, तो उसे ऐसा करना चाहिए, खासकर यदि इसमें पैसा खर्च होता है। »
जैसा कि लेख बताता है, छवि टैगिंग समस्याएं 2004 से मौजूद हैं, और 2010 में हमलों ने उन्हें 100% समय हरा दिया। इसके बावजूद, Google ने फ़ॉलबैक छवि पहचान सुरक्षा चुनौती के साथ reCAPTCHA v2 पेश किया जो चार साल पहले असुरक्षित साबित हुआ था।
लेखकों के अनुसार, सुरक्षा के दृष्टिकोण से इसका कोई मतलब नहीं है। लेकिन यह समझ में आता है यदि लक्ष्य छवि टैगिंग डेटा (कैप्चा छवियों को टैग करने वाले उपयोगकर्ताओं के परिणाम) प्राप्त करना है जो Google बेचा जाता है क्लाउड सेवा के रूप में। कई इंटरनेट उपयोगकर्ताओं का मानना है कि reCAPTCHA द्वारा प्रस्तुत पहेलियाँ – जैसे तस्वीरों में ट्रैफिक लाइट और साइकिल की पहचान करना – सेल्फ-ड्राइविंग कारों को बेहतर बनाने के लिए प्रशिक्षण डेटा एकत्र करने के तरीकों की तरह संदेहास्पद लगती हैं। मैंने अभी फेंक दिया वैसे, वेमो स्वायत्त वाहन परियोजना के लिए अतिरिक्त $5 बिलियन।
दस्तावेज़ में कहा गया है, “यह निष्कर्ष निकाला जा सकता है कि reCAPTCHA v2 का वास्तविक उद्देश्य एक सुरक्षा सेवा के रूप में विज्ञापन और डेटा लाभ के लिए छवि टैगिंग और कुकी ट्रैकिंग का निःशुल्क कार्य है।”
“मुझे लगता है कि आईटी सुरक्षा में जटिल एआई समस्याओं के लिए बिल्कुल कोई जगह नहीं है,” सियरल्स ने सुझाव दिया। “इस प्रयोग ने कुछ कम्प्यूटेशनल क्षमताओं में सुधार किया है, लेकिन इस तकनीक के उपयोग के माध्यम से कोई यथार्थवादी या मापने योग्य सुरक्षा हासिल नहीं की गई है। »
Google ने टिप्पणी के अनुरोध का जवाब नहीं दिया। ®
शाम 6:30 यूटीसी जोड़ने के लिए अद्यतन किया गया
को दिए गए एक बयान में रजिस्टर इस कहानी के प्रकाशित होने के बाद, Google के प्रवक्ता ने कहा:
Google की टिप्पणी पर प्रतिक्रिया देने के लिए कहे जाने पर, Searles ने नीचे कई बिंदुओं पर चर्चा की।
इंटरनेट दिग्गज के इस दावे के संबंध में कि “reCAPTCHA उपयोगकर्ता डेटा का उपयोग reCAPTCHA सेवा में सुधार के अलावा किसी अन्य उद्देश्य के लिए नहीं किया जाता है, जिसे सेवा की शर्तें स्पष्ट करती हैं।”
“क्या वे इसे अपने सभी रिकॉर्डों के सार्वजनिक ऑडिट से साबित कर सकते हैं? सील्स ने पूछा। “हालाँकि वे दावा कर सकते हैं कि आज यही मामला है, श्वेत पत्र में ऐसा नहीं कहा गया है (पीडीएफ). “रीकैप्चा” में “री” का अर्थ एमएल मॉडल को प्रशिक्षित करने के लिए कैप्चा से डेटा का पुन: उपयोग करना है।
“इसके अलावा, कानूनी रूप से कहें तो, यह एक बहुत ही अस्पष्ट बयान है: आप reCAPTCHA उपयोगकर्ता डेटा को बेचने पर सेवा में सुधार पर विचार कर सकते हैं, क्योंकि आप उस पैसे को ले सकते हैं और इसे reCAPTCHA में पुनः निवेश कर सकते हैं और इसे एक सुधार माना जाएगा। ध्यान दें कि वे यह दावा नहीं करते कि वे उपयोगकर्ता डेटा नहीं बेचते हैं। »
इसके अतिरिक्त, “हमारा अधिकांश उपयोगकर्ता आधार reCAPTCHA v3 पर चला गया है, जो अदृश्य स्कोरिंग के माध्यम से धोखाधड़ी का पता लगाने में सुधार करता है। »
सियरल्स ने कहा, “2019 में मामूली रूप से नजरअंदाज किया गया, reCAPTCHA v3 अपनी सुरक्षा का कोई पुख्ता सबूत नहीं देता है।” “अदृश्य स्कोरिंग, उर्फ ब्लैक बॉक्स, एक हास्यास्पद दावा है और इसका ट्यूरिंग टेस्ट या कैप्चा से कोई लेना-देना नहीं है। »
इसके संबंध में: “भले ही कोई साइट अभी भी उत्पाद की पिछली पीढ़ी पर थी, reCAPTCHA v2 विज़ुअल चुनौती में सभी छवियां पूर्व-लेबल हैं और उपयोगकर्ता इनपुट छवियों को लेबल करने में कोई भूमिका नहीं निभाता है। »
“क्या वे इस तरह के दावे को साबित करने के लिए सभी ऐतिहासिक रीकैप्चा समाधानों से सभी डेटा सार्वजनिक रूप से जारी करेंगे? सील्स ने पूछा।
“विशेष रूप से, वे दावा 2014 में, उन्होंने इसे “क्लासिक इमेज लेबलिंग कंप्यूटर विज़न समस्या” के आधार पर जोड़ा, जब यह कंप्यूटर विज़न समस्या थी हल किया 2010 में 100 प्रतिशत सटीकता के साथ। इससे पहले इस ब्लॉग में उन्होंने 99 प्रतिशत सटीकता के साथ कंप्यूटर द्वारा हल करने की क्षमता के कारण विकृत पाठ को चरणबद्ध तरीके से समाप्त करने का दावा किया था।
“या तो अत्यधिक अक्षमता है या भारी विरोधाभास है। “आइए विफल प्रौद्योगिकी को और भी अधिक विफल प्रौद्योगिकी से बदलें, क्योंकि यह अधिक सुरक्षित है!” यह बिल्कुल स्पष्ट है कि उन्होंने इसका उपयोग मशीन लर्निंग मॉडल को प्रशिक्षित करने के लिए किया, क्योंकि रीकैप्चा का उद्देश्य भी यही है। »