मानव र मेसिन छुट्याउने प्रविधि : क्याप्चाको विकास र भविष्य

क्याप्चाको कथा: मान्छे र बट छुट्याउने सानो बाकसभित्रको ठूलो विज्ञान

शुक्रबार, १ जेठ, २०८३

मानव र मेसिन छुट्याउने प्रविधि : क्याप्चाको विकास र भविष्य

काठमाडौं । कल्पना गर्नुहोस्, तपाईं अनलाइन हवाई टिकट काट्दै हुनुहुन्छ । सबमिट बटन थिच्नेबित्तिकै एउटा सानो बाकस देखापर्छ ; “के तपाईं रोबोट हुनुहुन्छ ?” पहिलो नजरमा यो प्रश्न अचम्म लाग्छ । आखिर कम्प्युटरलाई नै म मान्छे हुँ भनेर किन पुष्टि गर्नुपर्यो ? अनि त्यो बाकसमा टिक लगाएर मानव भएको कसरी प्रमाणित हुन्छ ? के कुनै स्वचालित बटले पनि त्यो टिक लगाउन सक्दैन र ? यो त अदालतमा हत्यारालाई ‘तिमीले हत्या गर्यौ ?’ भनेर सोध्नुजस्तै भयो, ‘मैले त केही गरेकै छैन’ भन्ने उत्तर आउनु स्वाभाविक हो ।

तर यही साधारण प्रश्नको पछाडि एउटा गहिरो वैज्ञानिक खेल लुकेको छ, जसको सुरुवात महान गणितज्ञ एलन ट्युरिङको ‘अनुकरण खेल’बाट भएको थियो, र आज यो साइबर सुरक्षाको मेरुदण्ड बनेको छ । यो कथा हो क्याप्चा (CAPTCHA) को विकास यात्राको ।

null

क्याप्चा के हो ?

क्याप्चाको पूरा नाम हो; Completely Automated Public Turing Test to Tell Computers and Humans Apart (पूर्ण रूपमा स्वचालित सार्वजनिक ट्युरिङ परीक्षण, जसले कम्प्युटर र मानव छुट्ट्याउँछ) । निकै लामो र जटिल नाम, भएपनि यसलाई बुझ्न एकदमै सहज छ ।

ट्युरिङ टेस्ट के हो ?

सन् १९५० को दशकमा बेलायती गणितज्ञ एलन ट्युरिङले आफ्ना समकालीनहरूसँग बहस गरिरहेका थिए, के मेसिन (डिजिटल कम्प्युटर) ले कहिल्यै मानव स्तरको बुद्धि हासिल गर्न सक्छ ? आफ्नो अडान प्रमाणित गर्न उनले एक खेल प्रस्ताव गरे । यसमा एक प्रश्नकर्ताले टेक्स्ट च्याटमार्फत एक मानव र एक कम्प्युटरलाई प्रश्न सोध्छ ।

यदि प्रश्नकर्ताले दुवैको उत्तरमा कुनै भिन्नता पत्ता लगाउन सकेन र कम्प्युटरले सफलतापूर्वक आफूलाई मानवको रूपमा प्रस्तुत गर्यो भने परीक्षा पास हुन्छ । ट्युरिङले यसलाई ‘द इमिटेसन गेम’ (अनुकरण खेल) नाम दिए । दशकौंपछि यही सिद्धान्तलाई मानव र कम्प्युटर छुट्ट्याउने परीक्षण बनाइयो; क्याप्चा ।

सन् २००० मा २२ वर्षीय युवा लुइस भोन आन (Luis von Ahn) र उनका प्राध्यापक म्यानुएल ब्लमले विभिन्न नेटवर्क र वेबसाइटलाई स्वचालित आक्रमणबाट जोगाउन क्याप्चाको विकास गरे ।

null

किन चाहिन्छ क्याप्चा ?

‘बट’ (Bot) शब्द तपाईंले सुन्नुभएकै होला । बट भनेका स्वचालित सफ्टवेयर प्रोग्राम हुन् जसले दिइएको स्क्रिप्टअनुसार कुनै कार्य मानवभन्दा धेरै गुणा छिटो गर्न सक्छन् । खोज इन्जिन बटले वेबपेज स्क्यान गरेर सूचीकृत गर्नु, वा च्याटबटले मानव संवादको नक्कल गर्नुजस्ता उपयोगी बट पनि छन् । तर अर्कोतिर दुर्भावनापूर्ण बटहरूले स्प्याम फैलाउने, अकाउन्ट कब्जा गर्ने र डिडओएस (DDoS – Distributed Denial of Service) आक्रमण गरेर ठूला वेबसाइट धराशायी बनाउने गर्छन् ।

यदि यिनलाई खुला छाडियो भने के-के हुन सक्छ ?

क्रेडेन्सियल स्टफिङ (चोरी भएका पासवर्ड अरू खातामा प्रयोग गर्ने)
सामग्री चोरी वा स्क्र्यापिङ
डस (DoS) र डिडस (DDoS) आक्रमण
इमेल ठेगाना संकलन गरेर स्पाम गर्ने
ब्रूट फोर्स पासवर्ड क्र्याकिङ
अनलाइन मतदानको नतिजा बिगार्ने
टिकट को बल्क खरिद गरी कालोबजारी गर्ने

सन् २०१३ मा अमेरिकी सुपरमार्केट चेन ‘टार्गेट’ (Target) ले डेटा उल्लंघनको सामना गर्नुपर्यो, जसले ७ करोड प्रयोगकर्तालाई असर पुर्यायो । घटनाको एउटा प्रमुख कारण थियो, त्यतिबेला टार्गेटको भेन्डर पोर्टलमा क्याप्चा थिएन । यही कारणले लाखौं प्रयोगकर्तालाई जोगाउन र ठूला धोखाधडी रोक्न क्याप्चा जरुरी हुन्छ ।

क्याप्चाले कसरी काम गर्छ ?

प्रारम्भिक क्याप्चा दृश्य परीक्षणमा आधारित थिए । मानवको तुलनामा स्वचालित बटको दृश्य डेटा प्रशोधन गर्ने क्षमता कमजोर हुन्छ भन्ने तथ्य यसले उपयोग गर्थ्यो । सुरुमा ती टेढोमेढो, आपसमा जेलिएका अक्षरहरू थिए, जसलाई पढेर बाकसमा टाइप गर्नुपर्थ्यो ।

क्याप्चाका प्रमुख प्रकार

१. टेक्स्ट–आधारित क्याप्चा
सबैभन्दा पुरानो रूप । यसमा जानीजानी बिगारिएका अक्षर, अनियमित स्केलिङ, पृष्ठभूमिमा धर्सा वा कोलाजले सजिएका चित्र हुन्थे । बटले यस्तो पढ्न सक्दैन भन्ने अनुमान थियो ।

null

२. इमेज–आधारित क्याप्चा
“ट्राफिक सङ्केत भएका सबै तस्वीरमा क्लिक गर्नुहोस्” , यो तपाईंले धेरैपटक देख्नुभएको होला । यी इमेज क्याप्चा हुन्, जसले छवि पहिचान र अर्थ वर्गीकरण दुवैको माग गर्छन् । मानिसका लागि सजिलो तर बटका लागि निकै कठिन ।

३. अडियो क्याप्चा
दृष्टिविहीन प्रयोगकर्ताका लागि यो विकल्प ल्याइयो । पृष्ठभूमिको आवाजसहित अक्षर वा अङ्कको रेकर्डिङ सुनाइन्छ, जसलाई सुनेर भर्नुपर्छ । बटले यसलाई पनि छिचोल्न सक्दैन ।

यी क्याप्चा लाखौं मानिसले प्रत्येक घन्टा समाधान गरिरहेका थिए, र सबै ठीक ठाक चलिरहेको थियो । तर लुइस भोन आनले अर्को अवसर देखे ।

रिक्याप्चाको जन्म

लुइसले भने, “यो प्रणालीले दश सेकेन्डका टुक्रामा करोडौं घन्टाको अमूल्य मानव मस्तिष्क चक्र खेर फालिरहेको थियो ।” प्रतिदिन २० करोड शब्द डिसाइफर गर्दा ५ लाख घन्टा मानव प्रयास अनुत्पादक रूपमा गइरहेको थियो । उनले सोचे, पढ्न गाह्रो हुने किसिमको पुराना पुस्तकका स्क्रिप्ट नै क्याप्चाका रूपमा देखाउने ?

null

त्यतिबेला ओसीआर (OCR – Optical Character Recognition) ले स्क्यान गरिएका करिब २० प्रतिशत शब्द पढ्न सक्दैनथ्यो । लुइसको नयाँ विचारले प्रयोगकर्तालाई अनजानमै ओसीआरलाई ती अस्पष्ट शब्द पढाउने काममा लगाइदिन्थ्यो । यसरी जन्मियो रिक्याप्चा (reCAPTCHA) । यसरी डिजिटाइज हुने पहिलो पुस्तक थियो— न्युयोर्क टाइम्सको अभिलेख, जुन सन् १८५१ देखिका १ करोड ३० लाख लेख समेट्छ ।

रिक्याप्चाले कसरी काम गर्छ ?

यो क्राउडसोर्सिङमा आधारित छ । पहिले कुनै पुस्तक डिजिटल रूपमा स्क्यान गरिन्छ । रिक्याप्चा प्रणालीले दुई शब्द देखाउँछ; एउटा पहिल्यै ओसीआरले पढिसकेको (नियन्त्रण शब्द) र अर्को नपढिएको शब्द । प्रयोगकर्ताले दुवै अनुमान गर्छन् । यदि पहिलो शब्द सही भए, प्रणालीले दोस्रो शब्दको अनुमानलाई विश्वास गर्छ । यही दोस्रो शब्द थुप्रै प्रयोगकर्तालाई देखाइन्छ, र धेरैको मिल्दोजुल्दो जवाफ आएपछि त्यो शब्द प्रमाणित भएर डिजिटल पुस्तकमा अङ्कित हुन्छ । यसरी एकै पटक मानव प्रमाणीकरण र ज्ञानको डिजिटलीकरण दुइटै उद्देश्य पूरा हुन्थ्यो ।

सन् २००९ मा गुगलले ठूलो तस्वीर देख्यो र गुगल बुक्स परियोजनाका लागि रिक्याप्चालाई खरिद गर्यो। गुगल बुक्स संसारका सबै पुस्तक डिजिटाइज गर्ने महत्वाकाङ्क्षी योजना थियो । अक्टोबर २०१९ सम्म गुगलले ४ करोडभन्दा बढी पुस्तक स्क्यान गरिसकेको थियो, यद्यपि प्रकाशक र लेखकसँगको प्रतिलिपि अधिकार कानुनी लडाइँका कारण परियोजना सोचेजस्तो अघि बढेन ।

null

चुनौती र नोक्याप्चा रिक्याप्चाको उदय

सिस्टम सुरक्षित बन्दै गयो, स्क्यामरहरु पनि चतुर हुँदै गए । सन् २०१४ को एक गुगल अध्ययनले देखायो कि आधुनिक कृत्रिम बुद्धिमत्ता (एआई) ले ९९.८ प्रतिशत शुद्धतासाथ अति बिगारिएका अक्षर पनि पढ्न सक्थ्यो, र तस्वीरमा भएका अङ्क ९० प्रतिशत शुद्धतामा चिन्न सक्थ्यो । दृश्य परीक्षण अब पहिलेजस्तो भरपर्दो रहेन ।

त्यसपछि आयो क्रान्तिकारी एपीआई (API), नोक्याप्चा रिक्याप्चा (NoCAPTCHA reCAPTCHA) । त्यही साधारण चेकबक्स, “म रोबोट होइन” भन्नेमा टिक लगाउने । तर यो जति सरल देखिन्छ, पृष्ठभूमिमा त्यति नै जटिल छ ।

नोक्याप्चा रिक्याप्चाले कसरी काम गर्छ ?

यसले ‘एडभान्स्ड रिस्क एनालाइसिस एपीआई’ चलाउँछ, जो पृष्ठभूमिमा लगातार सक्रिय हुन्छ । यसले बक्समा पुग्नुअघि, टिक लगाउने बेला र त्यसपछि माउसको चाललाई ख्याल गर्छ । प्रयोगकर्ताको समग्र अन्तर्क्रिया; कर्सरको हाउभाउ, अनियमित र हलचलपूर्ण गति, पृष्ठ स्क्रोल गर्ने तरिका, यी सबैले मानव हो कि बट पत्ता लगाउँछ । स्वचालित बटसँग पूर्वलिखित स्क्रिप्ट हुन्छ; तिनले सिधा टिक मात्र गर्छन्, यताउता घुम्दैनन् । तर अझै शंका बाँकी रहे गुगलले आइपी ठेगाना, कुकिज (cookies) जस्ता अरू सङ्केत प्रयोग गर्छ । परीक्षा पास गर्न नसकेपछि मात्र पुरानो शैलीको इमेज वा टेक्स्ट क्याप्चा देखाइन्छ ।

अर्को आविष्कार : हनिपट प्रविधि

क्याप्चाको नयाँ पुस्ताको रूपमा हनिपट (Honeypot) विधि आएको छ, जसले छलको सहारा लिन्छ । वेबसाइटको फारममा मानिसले देख्न नसक्ने एउटा गुप्त फिल्ड राखिन्छ । सामान्य प्रयोगकर्ताले त्यो फिल्ड देख्दैनन्, त्यसैले भर्दैनन् । तर बटले सबै फिल्ड स्वतः भर्छ । त्यो अदृश्य फिल्ड भरिएको पाइनेबित्तिकै सिस्टमले थाहा पाउँछ, यो बट हो । यो प्रयोगकर्ताका लागि बिनाअवरोध पहिचानको पद्धति हो ।

null

अबको बाटो के ?

कुनै पनि इन्जिनियर गरिएको चिजलाई पर्याप्त प्रेरणा भएमा रिभर्स इन्जिनियर गर्न सकिन्छ । बटहरू अझ बौद्धिक हुँदै छन्, क्याप्चा फार्महरू (मानिसबाटै क्याप्चा समाधान गर्ने गिरोह) सक्रिय छन् । अनि ग्राहकलाई पटकपटक इमेज छान्न लगाउँदा रिस उठ्छ ।

यस्तो झन्झटिलो सुरक्षा दीर्घकालीन समाधान हुन सक्दैन । त्यसैले अनलाइन व्यवसायले बट पत्ता लगाउने नयाँ प्रविधिमा लगानी गर्नैपर्छ, जसले प्रयोगकर्ता अनुभव पनि राम्रो राखोस् । तर प्रविधिको सौन्दर्य नै यही हो, यो कहिल्यै स्थिर बस्दैन । त्यसैकारणले क्याप्चाको पनि अझै आधुनिकीकरण हुँदैन् भनेर भन्न सकिँदैन् ।