काठमाडौं । कल्पना गर्नुहोस्, तपाईं अनलाइन हवाई टिकट काट्दै हुनुहुन्छ । सबमिट बटन थिच्नेबित्तिकै एउटा सानो बाकस देखापर्छ ; “के तपाईं रोबोट हुनुहुन्छ ?” पहिलो नजरमा यो प्रश्न अचम्म लाग्छ । आखिर कम्प्युटरलाई नै म मान्छे हुँ भनेर किन पुष्टि गर्नुपर्यो ? अनि त्यो बाकसमा टिक लगाएर मानव भएको कसरी प्रमाणित हुन्छ ? के कुनै स्वचालित बटले पनि त्यो टिक लगाउन सक्दैन र ? यो त अदालतमा हत्यारालाई ‘तिमीले हत्या गर्यौ ?’ भनेर सोध्नुजस्तै भयो, ‘मैले त केही गरेकै छैन’ भन्ने उत्तर आउनु स्वाभाविक हो ।
तर यही साधारण प्रश्नको पछाडि एउटा गहिरो वैज्ञानिक खेल लुकेको छ, जसको सुरुवात महान गणितज्ञ एलन ट्युरिङको ‘अनुकरण खेल’बाट भएको थियो, र आज यो साइबर सुरक्षाको मेरुदण्ड बनेको छ । यो कथा हो क्याप्चा (CAPTCHA) को विकास यात्राको ।

क्याप्चा के हो ?
क्याप्चाको पूरा नाम हो; Completely Automated Public Turing Test to Tell Computers and Humans Apart (पूर्ण रूपमा स्वचालित सार्वजनिक ट्युरिङ परीक्षण, जसले कम्प्युटर र मानव छुट्ट्याउँछ) । निकै लामो र जटिल नाम, भएपनि यसलाई बुझ्न एकदमै सहज छ ।
ट्युरिङ टेस्ट के हो ?
सन् १९५० को दशकमा बेलायती गणितज्ञ एलन ट्युरिङले आफ्ना समकालीनहरूसँग बहस गरिरहेका थिए, के मेसिन (डिजिटल कम्प्युटर) ले कहिल्यै मानव स्तरको बुद्धि हासिल गर्न सक्छ ? आफ्नो अडान प्रमाणित गर्न उनले एक खेल प्रस्ताव गरे । यसमा एक प्रश्नकर्ताले टेक्स्ट च्याटमार्फत एक मानव र एक कम्प्युटरलाई प्रश्न सोध्छ ।
यदि प्रश्नकर्ताले दुवैको उत्तरमा कुनै भिन्नता पत्ता लगाउन सकेन र कम्प्युटरले सफलतापूर्वक आफूलाई मानवको रूपमा प्रस्तुत गर्यो भने परीक्षा पास हुन्छ । ट्युरिङले यसलाई ‘द इमिटेसन गेम’ (अनुकरण खेल) नाम दिए । दशकौंपछि यही सिद्धान्तलाई मानव र कम्प्युटर छुट्ट्याउने परीक्षण बनाइयो; क्याप्चा ।
सन् २००० मा २२ वर्षीय युवा लुइस भोन आन (Luis von Ahn) र उनका प्राध्यापक म्यानुएल ब्लमले विभिन्न नेटवर्क र वेबसाइटलाई स्वचालित आक्रमणबाट जोगाउन क्याप्चाको विकास गरे ।
किन चाहिन्छ क्याप्चा ?
‘बट’ (Bot) शब्द तपाईंले सुन्नुभएकै होला । बट भनेका स्वचालित सफ्टवेयर प्रोग्राम हुन् जसले दिइएको स्क्रिप्टअनुसार कुनै कार्य मानवभन्दा धेरै गुणा छिटो गर्न सक्छन् । खोज इन्जिन बटले वेबपेज स्क्यान गरेर सूचीकृत गर्नु, वा च्याटबटले मानव संवादको नक्कल गर्नुजस्ता उपयोगी बट पनि छन् । तर अर्कोतिर दुर्भावनापूर्ण बटहरूले स्प्याम फैलाउने, अकाउन्ट कब्जा गर्ने र डिडओएस (DDoS – Distributed Denial of Service) आक्रमण गरेर ठूला वेबसाइट धराशायी बनाउने गर्छन् ।
यदि यिनलाई खुला छाडियो भने के-के हुन सक्छ ?
-
क्रेडेन्सियल स्टफिङ (चोरी भएका पासवर्ड अरू खातामा प्रयोग गर्ने)
-
सामग्री चोरी वा स्क्र्यापिङ
-
डस (DoS) र डिडस (DDoS) आक्रमण
-
इमेल ठेगाना संकलन गरेर स्पाम गर्ने
-
ब्रूट फोर्स पासवर्ड क्र्याकिङ
-
अनलाइन मतदानको नतिजा बिगार्ने
-
टिकट को बल्क खरिद गरी कालोबजारी गर्ने
सन् २०१३ मा अमेरिकी सुपरमार्केट चेन ‘टार्गेट’ (Target) ले डेटा उल्लंघनको सामना गर्नुपर्यो, जसले ७ करोड प्रयोगकर्तालाई असर पुर्यायो । घटनाको एउटा प्रमुख कारण थियो, त्यतिबेला टार्गेटको भेन्डर पोर्टलमा क्याप्चा थिएन । यही कारणले लाखौं प्रयोगकर्तालाई जोगाउन र ठूला धोखाधडी रोक्न क्याप्चा जरुरी हुन्छ ।
क्याप्चाले कसरी काम गर्छ ?
प्रारम्भिक क्याप्चा दृश्य परीक्षणमा आधारित थिए । मानवको तुलनामा स्वचालित बटको दृश्य डेटा प्रशोधन गर्ने क्षमता कमजोर हुन्छ भन्ने तथ्य यसले उपयोग गर्थ्यो । सुरुमा ती टेढोमेढो, आपसमा जेलिएका अक्षरहरू थिए, जसलाई पढेर बाकसमा टाइप गर्नुपर्थ्यो ।
क्याप्चाका प्रमुख प्रकार
१. टेक्स्ट–आधारित क्याप्चा
सबैभन्दा पुरानो रूप । यसमा जानीजानी बिगारिएका अक्षर, अनियमित स्केलिङ, पृष्ठभूमिमा धर्सा वा कोलाजले सजिएका चित्र हुन्थे । बटले यस्तो पढ्न सक्दैन भन्ने अनुमान थियो ।
२. इमेज–आधारित क्याप्चा
“ट्राफिक सङ्केत भएका सबै तस्वीरमा क्लिक गर्नुहोस्” , यो तपाईंले धेरैपटक देख्नुभएको होला । यी इमेज क्याप्चा हुन्, जसले छवि पहिचान र अर्थ वर्गीकरण दुवैको माग गर्छन् । मानिसका लागि सजिलो तर बटका लागि निकै कठिन ।
३. अडियो क्याप्चा
दृष्टिविहीन प्रयोगकर्ताका लागि यो विकल्प ल्याइयो । पृष्ठभूमिको आवाजसहित अक्षर वा अङ्कको रेकर्डिङ सुनाइन्छ, जसलाई सुनेर भर्नुपर्छ । बटले यसलाई पनि छिचोल्न सक्दैन ।
यी क्याप्चा लाखौं मानिसले प्रत्येक घन्टा समाधान गरिरहेका थिए, र सबै ठीक ठाक चलिरहेको थियो । तर लुइस भोन आनले अर्को अवसर देखे ।
रिक्याप्चाको जन्म
लुइसले भने, “यो प्रणालीले दश सेकेन्डका टुक्रामा करोडौं घन्टाको अमूल्य मानव मस्तिष्क चक्र खेर फालिरहेको थियो ।” प्रतिदिन २० करोड शब्द डिसाइफर गर्दा ५ लाख घन्टा मानव प्रयास अनुत्पादक रूपमा गइरहेको थियो । उनले सोचे, पढ्न गाह्रो हुने किसिमको पुराना पुस्तकका स्क्रिप्ट नै क्याप्चाका रूपमा देखाउने ?

त्यतिबेला ओसीआर (OCR – Optical Character Recognition) ले स्क्यान गरिएका करिब २० प्रतिशत शब्द पढ्न सक्दैनथ्यो । लुइसको नयाँ विचारले प्रयोगकर्तालाई अनजानमै ओसीआरलाई ती अस्पष्ट शब्द पढाउने काममा लगाइदिन्थ्यो । यसरी जन्मियो रिक्याप्चा (reCAPTCHA) । यसरी डिजिटाइज हुने पहिलो पुस्तक थियो— न्युयोर्क टाइम्सको अभिलेख, जुन सन् १८५१ देखिका १ करोड ३० लाख लेख समेट्छ ।
रिक्याप्चाले कसरी काम गर्छ ?
यो क्राउडसोर्सिङमा आधारित छ । पहिले कुनै पुस्तक डिजिटल रूपमा स्क्यान गरिन्छ । रिक्याप्चा प्रणालीले दुई शब्द देखाउँछ; एउटा पहिल्यै ओसीआरले पढिसकेको (नियन्त्रण शब्द) र अर्को नपढिएको शब्द । प्रयोगकर्ताले दुवै अनुमान गर्छन् । यदि पहिलो शब्द सही भए, प्रणालीले दोस्रो शब्दको अनुमानलाई विश्वास गर्छ । यही दोस्रो शब्द थुप्रै प्रयोगकर्तालाई देखाइन्छ, र धेरैको मिल्दोजुल्दो जवाफ आएपछि त्यो शब्द प्रमाणित भएर डिजिटल पुस्तकमा अङ्कित हुन्छ । यसरी एकै पटक मानव प्रमाणीकरण र ज्ञानको डिजिटलीकरण दुइटै उद्देश्य पूरा हुन्थ्यो ।
सन् २००९ मा गुगलले ठूलो तस्वीर देख्यो र गुगल बुक्स परियोजनाका लागि रिक्याप्चालाई खरिद गर्यो। गुगल बुक्स संसारका सबै पुस्तक डिजिटाइज गर्ने महत्वाकाङ्क्षी योजना थियो । अक्टोबर २०१९ सम्म गुगलले ४ करोडभन्दा बढी पुस्तक स्क्यान गरिसकेको थियो, यद्यपि प्रकाशक र लेखकसँगको प्रतिलिपि अधिकार कानुनी लडाइँका कारण परियोजना सोचेजस्तो अघि बढेन ।
चुनौती र नोक्याप्चा रिक्याप्चाको उदय
सिस्टम सुरक्षित बन्दै गयो, स्क्यामरहरु पनि चतुर हुँदै गए । सन् २०१४ को एक गुगल अध्ययनले देखायो कि आधुनिक कृत्रिम बुद्धिमत्ता (एआई) ले ९९.८ प्रतिशत शुद्धतासाथ अति बिगारिएका अक्षर पनि पढ्न सक्थ्यो, र तस्वीरमा भएका अङ्क ९० प्रतिशत शुद्धतामा चिन्न सक्थ्यो । दृश्य परीक्षण अब पहिलेजस्तो भरपर्दो रहेन ।
त्यसपछि आयो क्रान्तिकारी एपीआई (API), नोक्याप्चा रिक्याप्चा (NoCAPTCHA reCAPTCHA) । त्यही साधारण चेकबक्स, “म रोबोट होइन” भन्नेमा टिक लगाउने । तर यो जति सरल देखिन्छ, पृष्ठभूमिमा त्यति नै जटिल छ ।
नोक्याप्चा रिक्याप्चाले कसरी काम गर्छ ?
यसले ‘एडभान्स्ड रिस्क एनालाइसिस एपीआई’ चलाउँछ, जो पृष्ठभूमिमा लगातार सक्रिय हुन्छ । यसले बक्समा पुग्नुअघि, टिक लगाउने बेला र त्यसपछि माउसको चाललाई ख्याल गर्छ । प्रयोगकर्ताको समग्र अन्तर्क्रिया; कर्सरको हाउभाउ, अनियमित र हलचलपूर्ण गति, पृष्ठ स्क्रोल गर्ने तरिका, यी सबैले मानव हो कि बट पत्ता लगाउँछ । स्वचालित बटसँग पूर्वलिखित स्क्रिप्ट हुन्छ; तिनले सिधा टिक मात्र गर्छन्, यताउता घुम्दैनन् । तर अझै शंका बाँकी रहे गुगलले आइपी ठेगाना, कुकिज (cookies) जस्ता अरू सङ्केत प्रयोग गर्छ । परीक्षा पास गर्न नसकेपछि मात्र पुरानो शैलीको इमेज वा टेक्स्ट क्याप्चा देखाइन्छ ।
अर्को आविष्कार : हनिपट प्रविधि
क्याप्चाको नयाँ पुस्ताको रूपमा हनिपट (Honeypot) विधि आएको छ, जसले छलको सहारा लिन्छ । वेबसाइटको फारममा मानिसले देख्न नसक्ने एउटा गुप्त फिल्ड राखिन्छ । सामान्य प्रयोगकर्ताले त्यो फिल्ड देख्दैनन्, त्यसैले भर्दैनन् । तर बटले सबै फिल्ड स्वतः भर्छ । त्यो अदृश्य फिल्ड भरिएको पाइनेबित्तिकै सिस्टमले थाहा पाउँछ, यो बट हो । यो प्रयोगकर्ताका लागि बिनाअवरोध पहिचानको पद्धति हो ।
अबको बाटो के ?
कुनै पनि इन्जिनियर गरिएको चिजलाई पर्याप्त प्रेरणा भएमा रिभर्स इन्जिनियर गर्न सकिन्छ । बटहरू अझ बौद्धिक हुँदै छन्, क्याप्चा फार्महरू (मानिसबाटै क्याप्चा समाधान गर्ने गिरोह) सक्रिय छन् । अनि ग्राहकलाई पटकपटक इमेज छान्न लगाउँदा रिस उठ्छ ।
यस्तो झन्झटिलो सुरक्षा दीर्घकालीन समाधान हुन सक्दैन । त्यसैले अनलाइन व्यवसायले बट पत्ता लगाउने नयाँ प्रविधिमा लगानी गर्नैपर्छ, जसले प्रयोगकर्ता अनुभव पनि राम्रो राखोस् । तर प्रविधिको सौन्दर्य नै यही हो, यो कहिल्यै स्थिर बस्दैन । त्यसैकारणले क्याप्चाको पनि अझै आधुनिकीकरण हुँदैन् भनेर भन्न सकिँदैन् ।
स्नेहा झा