कीवर्डहरू -

सन् २०२५ मा एआई: नानो बनानादेखि सोरासम्म, प्रविधिमा नयाँ छलाङ

सन् २०२५ मा एआई: नानो बनानादेखि सोरासम्म, प्रविधिमा नयाँ छलाङ
एआईको सहायतामा बनाइएको तस्वीर

सन् २०२५ मा भएका केही प्रमुख आर्टिफिसियल इन्टेलिजेन्स (एआई) घोषणा र लञ्चहरूले प्रविधिलाई अनुसन्धान प्रयोगशालाबाट बाहिर निकालेर दैनिक कुराकानी र सार्वजनिक संस्कृतिको हिस्सा बनाइदिए।

गुगलले नानो बनाना मार्फत आफ्नो जेनेरेटिभ एआई क्षमतालाई इमेज र भाषा–आधारित रिजनिङमा अघि बढायो। ओपनएआईले सोरा लाई टेक्स्ट–टु–भिडियो डेमोबाट सोसल–फर्स्ट क्रिएटिभ एपमा रूपान्तरण गरेको थियो ।

परप्लेक्सिटीले कोमेट ब्राउजरमार्फत एआई–आधारित ब्राउजिङको दायरा विस्तार गर्‍यो भने मेटाले आफ्नो दीर्घकालीन एआई अनुसन्धानलाई सुपरइन्टेलिजेन्स ल्याब्स अन्तर्गत पुनःसंरचना गर्‍यो।

यी घोषणाहरू विशेष थिए—केवल के बनाइयो भन्ने कारणले होइन, बरु एआईलाई बुझ्ने सार्वजनिक दृष्टिकोण कति छिटो परिवर्तन हुँदैछ भन्ने संकेतले पनि।

नानो बनाना: इमेज एआईको नयाँ रूप

गुगलले अगस्ट २०२५ मा जेमिनी २.५ मोडेल परिवार अन्तर्गत Gemini 2.5 Flash Image सार्वजनिक गर्‍यो, जुन अनलाइन समुदायमा भाइरल हुँदै “नानो बनाना” नामले परिचित भयो। यो मोडेल एआई–समर्थित इमेज जेनेरेशन र एडिटिङमा केन्द्रित छ।

नानो बनानाले प्रयोगकर्तालाई नेचुरल भाषा प्रॉम्प्टमार्फत इमेज सिर्जना गर्न र उही इन्टरफेसबाट अपलोड गरिएका तस्बिरहरू सम्पादन गर्न दिन्छ। जेमिनी एपमा मोबाइल र डेस्कटप दुवैमा इन्किग्रेट गरिएको यस टुलले ब्याकग्राउन्ड परिवर्तन, लुगा वा वस्तु एड्जस्टमेन्ट, तथा इमेजमा बहुभाषिक टेक्स्ट थप्ने सुविधा प्रदान गर्छ।

गुगलका अनुसार, यसमा SynthID प्रविधि प्रयोग गरिएको छ, जसले एआई–जेनेरेटेड इमेजमा डिजिटल वाटरमार्क एम्बेड गरी स्रोत पहिचान गर्न मद्दत गर्छ।

सोरा एप: टेक्स्टबाट भिडियो, सोसल–फर्स्ट अनुभव

ओपनएआईले २०२५ मा सोरा मोबाइल एप सार्वजनिक गर्दै आफ्नो डिफ्युजन–आधारित टेक्स्ट–टु–भिडियो मोडेललाई उपभोक्ता–मुखी क्रिएटिभ टुलमा रूपान्तरण गर्‍यो। सोराले टेक्स्ट प्रॉम्प्ट वा रेफरेन्स इमेज प्रयोग गरी मोशन र साउन्डसहित ६० सेकेण्डसम्मका भिडियो क्लिपहरू सिर्जना गर्न सक्छ।

यस एपको लञ्चसँगै दि वाल्ट डिज्नी कम्पनीसँग भएको बहु–वर्षीय १ अर्ब डलरको साझेदारीले ठूलो ध्यान तान्यो। यस सहकार्य अन्तर्गत प्रयोगकर्ताहरूले स्टार वार्स र पिक्सरजस्ता फ्रेन्चाइजका लाइसेन्स प्राप्त डिज्नी क्यारेक्टरहरू जेनेरेटेड भिडियोमा प्रयोग गर्न सक्छन्। ओपनएआई र डिज्नीले यो सहकार्य डिसेम्बर २०२५ मा घोषणा गरेका थिए।

हाल सोरा एप आइओएसमा उपलब्ध छ र छिट्टै एन्ड्रोइडमा पनि आउने बताइएको छ। प्रयोगकर्ताहरूले जेनेरेटेड भिडियोहरू सिधै सपोर्टेड सोसल फिडमा शेयर गर्न सक्नेछन्, जसले सोरालाई केवल एपीआई डेमोभन्दा अघि बढाएर पूर्ण मिडिया प्लेटफर्मको अनुभव दिन्छ।

कोमेट: एआई–समर्थित ब्राउजिङ

परप्लेक्सिटी एआईले २०२५ मा आफ्नो पहिलो एआई ब्राउजर कोमेट लन्च गर्‍यो। जुलाईमा विन्डोज र म्याकओएसमा आएको यो ब्राउजर नोभेम्बरमा एन्ड्रोइडमा पनि विस्तार भयो।

क्रोमियममा आधारित कोमेटले पारम्परिक ब्राउजिङलाई एआई एजेन्टसँग जोड्छ। यसले वेबपेज समरी गर्न, ब्राउजिङ सन्दर्भमै प्रश्नहरूको उत्तर दिन, र ट्याब परिवर्तन नगरी कन्टेन्ट बुझ्न मद्दत गर्छ। क्रोम एक्सटेन्सन र ब्लिंक रेन्डरिङ इन्जिनसँग कम्प्याटिबिलिटी हुनु यसको थप विशेषता हो।

जेमिनी ३: गुगलको नेक्स्ट–जेनेरेशन मोडेल

२०२५ को अन्त्यतिर गुगलले जेमिनी ३ मोडेल परिवार सार्वजनिक गर्‍यो, जसमा जेमिनी ३ प्रो, जेमिनी ३ फ्ल्यास र जेमिनी ३ डीपथिंक समावेश छन्। जेमिनी ३ प्रो जटिल भाषा र इमेज रिजनिङका लागि डिजाइन गरिएको छ भने जेमिनी ३ फ्ल्यास कम लेटेन्सी र द्रुत प्रतिक्रियामा केन्द्रित छ।

यी मोडेलहरू जेमिनी एपीआईमार्फत गुगल क्लाउडमा उपलब्ध छन् र मोबाइल जेमिनी च्याटबट अनुभवका केही भागलाई पनि पावर गर्छन्।

मेटा सुपरइन्टेलिजेन्स ल्याब्स

मेटाले सन् २०२५ मा आफ्ना दीर्घकालीन एआई अनुसन्धान प्रयासहरूलाई मेटा सुपरइन्टेलिजेन्स ल्याब्स (MSL) अन्तर्गत पुनःसंरचना गर्‍यो। यस डिभिजनले पहिले छुट्टाछुट्टै रहेका मेटा एआई रिसर्च टोलीहरूलाई एउटै ढाँचामा ल्याएको छ।

स्केल एआईका संस्थापक अलेक्जान्डर वाङको नेतृत्वमा रहेको यो ल्याब उत्पाद लञ्चमा होइन, बरु दीर्घकालीन अनुसन्धानमा केन्द्रित रहने मेटाले स्पष्ट पारेको छ। यसको उद्देश्य मानव क्षमताभन्दा अगाडि जाने एआई प्रणालीहरूमा आधारभूत अनुसन्धान गर्नु हो।