माइक्रोसफ्टको नयाँ टेक्स्ट टू स्पीच एआइले प्रयोगकर्ताको आवाजलाई क्लोन गर्न सक्ने

मंगलबार, ३ माघ, २०७९

माइक्रोसफ्टको नयाँ टेक्स्ट टू स्पीच एआइले प्रयोगकर्ताको आवाजलाई क्लोन गर्न सक्ने भएको छ । यसले प्रयोगकर्ताले बोल्ने तरिका, आवाजको शैली सबैलाई जस्ताको त्यस्तै क्लोन गर्न सक्ने छ ।

टेक्स्ट टू स्पीच एआइलाई प्रयोगकर्ताको आवाज क्लोन गर्न तीन सेकेण्डको अडियो क्लिप भएमा मात्रै पनि पुग्नेछ । यो टेक्स्ट टू स्पीच एआइको नाम भ्याली रहेको छ । यस प्रणालीले न्यूरल कोडेक लैंग्वेज मोडेल प्रयोग गर्ने गर्दछ ।

यसलाई प्रयोग गर्न पनि एकदमै साधारण रहेको छ । यसका लागि कुनै अडियो स्याम्पल प्रयोग गरेर टेक्स्ट हालेमा वासतविक जस्तो सुनिने बोली पैदा हुने बताइएको छ ।

अहिलेसम्म अरु पनि थुप्रै टेक्स्ट टू स्पीच एआई बनिसकेका छन् र तिनीहरु सबैमा धेरै मात्रामा इन्पुट दिनुपर्ने हुन्छ तर भ्यालीमा तीन सेकेण्डको अडियो स्याम्पलले मात्तै पनि पुग्ने जनाइएको छ ।

भर्खरै

जेनजी आन्दोलनको तयारी र सञ्चालनमा डिस्कर्ड निर्णायक बनेको जाँचबुझ आयोगको निष्कर्ष

कीवर्डहरू -

माइक्रोसफ्टको नयाँ टेक्स्ट टू स्पीच एआइले प्रयोगकर्ताको आवाजलाई क्लोन गर्न सक्ने

लोकप्रिय

स्मार्टफोन अपडेट गर्दा यी ५ गल्ती नगर्नुहोस्, नत्र डिभाइस बिग्रन सक्छ

चीनको वीच्याटजस्तै नेपालमा पनि सुपर एप बनाउन आयोगको सुझाव, सबै सरकारी सेवा एउटै प्लेटफर्ममा ल्याउने प्रस्ताव

५ मिनेटमै वेबसाइटदेखि गीतसम्म: गुगल ल्याब्सको एआई टूलको कमाल

गूगल म्याप्समा ‘आस्क म्याप्स’ फिचर: अब प्रश्न सोधेरै पाउनुहोस् सही लोकेशन र सुझाव

भर्खरै

जेनजी आन्दोलनको तयारी र सञ्चालनमा डिस्कर्ड निर्णायक बनेको जाँचबुझ आयोगको निष्कर्ष

पठाओ नेपालको ‘डेलिभरीको सुनिश्चितता’ योजना: व्यापारीलाई सामानसहित रकम फिर्ताको ग्यारेन्टी

अब दृष्टिविहीनहरूले सुनेरै इसेवा चलाउन सक्ने फिचर आएको छ, कसरी गर्ने प्रयोग?

च्याटजीपीटी मेमोरीलाई गूगल जेमिनाईमा इम्पोर्ट गर्ने नयाँ फिचर सार्वजनिक

सम्बन्धित समाचार

जेनजी आन्दोलनको तयारी र सञ्चालनमा डिस्कर्ड निर्णायक बनेको जाँचबुझ आयोगको निष्कर्ष

पठाओ नेपालको ‘डेलिभरीको सुनिश्चितता’ योजना: व्यापारीलाई सामानसहित रकम फिर्ताको ग्यारेन्टी

अब दृष्टिविहीनहरूले सुनेरै इसेवा चलाउन सक्ने फिचर आएको छ, कसरी गर्ने प्रयोग?

च्याटजीपीटी मेमोरीलाई गूगल जेमिनाईमा इम्पोर्ट गर्ने नयाँ फिचर सार्वजनिक