आर्टिफिसियल इन्टेलिजेन्स (एआई) लाई केही समयअघिसम्म एक महँगो प्रविधिको रूपमा हेरिन्थ्यो, तर डिपसिक को आगमनपछि यो भ्रम समाप्त भएको छ । सामान्यतया कुनै पनि एआई टूल सार्वजनिक गर्नु अघि त्यसको प्रशिक्षण गर्नुपर्छ जुन लामो समयसम्म चल्ने र महँगो हुने गर्छ । तर अब चीनको प्रमुख स्टार्टअप डिपसिक र त्सिङहुआ विश्वविद्यालय मिलेर यस्तो एआई मोडेल विकास गरिरहेका छन् जसलाई नाम मात्रको प्रशिक्षण आवश्यक हुनेछ । यसको उद्देश्य एआई मोडेलको अपरेशनल खर्च घटाउनु र कम स्रोत–साधनमा पनि उच्च गुणस्तरीय प्रदर्शन हासिल गर्नु हो ।
जनवरीमा आफ्नो कम लागतमा राम्रो रिजनिङ क्षमता भएको मोडेलका कारण चर्चामा आएको डिपसिकले, बेइजिङस्थित यो प्रतिष्ठित शैक्षिक संस्थासँग मिलेर एउटा अनुसन्धानपत्र प्रकाशित गरेको छ ।
यस अनुसन्धानमा रिइन्फोर्समेन्ट लर्निङको एउटा नयाँ दृष्टिकोण प्रस्तुत गरिएको छ, जसलाई टोलीले “सेल्फ–प्रिन्सिपल्ड क्रिटिक ट्युनिङ“ नाम दिएको छ ।
के हो यो नयाँ प्रविधि?
यो प्रविधिले एआई मोडेलहरूलाई मानवीय प्राथमिकता अनुसार काम गर्न सक्षम बनाउँछ । यसमा ती उत्तरहरूलाई पुरस्कार दिइन्छ जुन सटीक र उपयोगी हुन्छन् । जहाँ परम्परागत रिइन्फोर्समेन्ट लर्निङ विशिष्ट कामहरूमा मात्र प्रभावकारी ठहरिएको थियो, त्यहीँ डिपसिकको यो इनोभेसन सामान्य र बहुआयामी प्रयोग मा पनि प्रभावकारी बनाउने प्रयास हो ।
अनुसन्धानपत्रअनुसार, यो नयाँ रणनीतिले हालको विधि र मोडेलहरूको तुलनामा अझ राम्रो प्रदर्शन गर्छ र साथमा कम्प्युटिङ स्रोतको खपत पनि घटाउँछ ।
डिपसिकले आफ्नो नयाँ मोडेलहरूलाई डिपसिक–जीआरएम नाम दिएको छ, जुन “जेनेरेलिस्ट रिवार्ड मोडेलिंग को छोटो रूप हो ।
कम्पनीले जनाएको अनुसार, यी मोडेलहरू ओपन सोर्स रूपमा सार्वजनिक गरिनेछन् जसबाट अन्य विकासकर्ताहरूले पनि यो प्रविधिको लाभ लिन सक्नेछन् ।