गूगलले आफ्नो एआई प्लेटफर्म जेमिनाइमा नयाँ ‘लिरिया ३ (Lyria 3)’ मोडेल समावेश गरेको घोषणा गरेको छ। यस मोडेलमार्फत प्रयोगकर्ताले केवल टेक्स्ट प्रम्प्टका आधारमा ३० सेकेन्डसम्मको संगीत ट्र्याक सिर्जना गर्न वा पहिल्यै बनेको ट्र्याकलाई आफूअनुसार रिमिक्स गर्न सक्नेछन्।
गुगलका अनुसार लिरिया ३ ले जेमिनीको पहिलेको टेक्स्ट, तस्बिर र भिडियो उत्पादन गर्ने क्षमतामा संगीत उत्पादनसमेत थपेको हो। यो सुविधा युट्युबको ड्रीमट्याक फिचरमा पनि उपलब्ध हुनेछ, जहाँ प्रयोगकर्ताले शर्ट्सका लागि विस्तृत ब्याकिङ ट्र्याक तयार गर्न सक्नेछन्।
संगीत बनाउन अत्यधिक विस्तृत निर्देशन आवश्यक नपर्ने गुगलले जनाएको छ। सामान्य प्रम्प्टबाट पनि प्रयोगयोग्य नतिजा प्राप्त गर्न सकिनेछ। उदाहरणका रूपमा कम्पनीले ‘a comical R&B slow jam about a sock finding their match’ जस्ता प्रम्प्ट उल्लेख गरेको छ।
यद्यपि प्रयोगकर्ताले चाहेको खण्डमा गीतको गति (टेम्पो), ड्रमिङ शैलीलगायतका व्यक्तिगत तत्वहरूमा थप नियन्त्रण गर्न सक्नेछन्। जेमिनीले तस्बिर वा भिडियोको आधारमा समेत संगीत सिर्जना गर्न सक्नेछ, र एल्बम आर्ट गुगलको ‘नानो बनाना’ इमेज मोडेलमार्फत तयार गर्न सकिनेछ।
गुगलका अनुसार लिरिया ३ अघिल्ला अडियो मोडेलहरूको तुलनामा बढी यथार्थपरक र सङ्गीतिक रूपमा जटिल ट्र्याक बनाउन सक्षम छ। यसले स्वतः गीतका शब्द (लिरिक्स) पनि तयार गर्न सक्छ। हालका लागि जेमिनीमार्फत उत्पादित गीत ३० सेकेन्डमा सीमित रहने भए पनि भविष्यमा यो अवधि बढ्न सक्ने संकेत कम्पनीले दिएको छ।
एआईमार्फत सिर्जित सामग्री दुरुपयोग नहोस् भन्ने उद्देश्यले जेमिनीबाट बनेका गीतमा गुगलको SynthID वाटरमार्क समावेश गरिनेछ। कम्पनीले गूगल आई/ओ २०२५ मा एआई सामग्री पहिचान गर्ने ‘SynthID Detector’ सार्वजनिक गरिसकेको छ।
हाल १८ वर्षभन्दा माथिका प्रयोगकर्ताले अंग्रेजी, स्पेनिस, जर्मन, फ्रेन्च, हिन्दी, जापानी, कोरियन वा पोर्चुगिज भाषामा जेमिनीमार्फत लिरिया ३ प्रयोग गर्न सक्नेछन्। गुगलले यो सुविधा आजैबाट चरणबद्ध रूपमा उपलब्ध गराउन थालेको जनाएको छ।
आईसीटी समाचार