मेटाको नयाँ एआई स्पीच टुल सार्वजनिक, उच्च गुणस्तरको अडियो क्लिप उत्पादनमा सघाउने

आइतबार, ३ असार, २०८०

मेटाले प्रयोगकर्ताका लागि जेनेरेटिभ एआई स्पीच टुल ल्याएको छ । यो स्वीच भ्वाइसबक्सको नाममा सार्वजनिक भएको छ । मेटाको नयाँ एआई स्पीच टुललाई अघिल्लो मोडलहरूभन्दा फरक सुविधाहरूसहित ल्याइएको छ ।

भ्वाइसबक्सले विभिन्न शैलीहरूमा उच्च गुणस्तरको अडियो क्लिपहरू उत्पादन गर्न सक्छ । भ्वाइसबक्सको प्रयोगले प्रयोगकर्ताले इनपुटको लागि नयाँ र ताजा डाटा दिन सक्छन् ।

यस बाहेक, भ्वाइसबक्सले प्रयोगकर्ताहरूलाई पुराना नमूनाहरू परिमार्जन गर्न अनुमति समेत दिन्छ । मेटाको यो नयाँ एआई मोडल ६ भाषाको सपोर्टमा ल्याइएको छ । थप रूपमा, मोडेलले कंटेंट एडिटिंग स्टाइल कन्भर्सेशनद्वारा छुट्टै नमुना जेनेरेसन गर्दछ ।

मिडिया रिपोर्टका अनुसार मेटाको यो नयाँ एआई स्पीच मोडेल ५० हजार घण्टाको रेकर्डेड स्पीचको साथ तयार गरिएको छ । थप रूपमा, मोडेललाई विभिन्न भाषाहरूमा सार्वजनिक गरिएको डोमेन अडियोबुकहरू प्रयोग गरेर पनि तालिम दिइएको छ ।

मेटाको स्पीच मोडेल बोल्न नसक्ने प्रयोगकर्ताहरूको लागि विशेष मोडेल हो । मोडेलको टेक्स्ट टु स्पीच सुविधाको साथ, यसले स्पीच जेनेरेसन गर्न सक्छ ।

टेक्स्ट–टु–स्पीच सुविधाको साथ, मोडेलले दिइएको इनपुटसँग अडियो शैली मिलाउन प्रयास गर्छ, जस पछि टेक्सट–टू–स्पीच उत्पन्न हुन्छ । यो मोडल प्रयोगकर्ताका लागि भ्वाइस कस्टमाइजेसन सुविधाको साथ आउँछ ।

मोडललाई क्रस–लिङ्गुअल स्टाइल ट्रान्सफर फिचरसहित ल्याइएको छ । अंग्रेजी, फ्रेन्च, जर्मन, स्पेनिश, पोलिश र पोर्चुगिज भाषाहरूको साथ, प्रयोगकर्ताले भ्वाइस बक्समा स्पीच र टेक्सट इनपुट प्रदान गर्न सक्छ ।

दिइएको टेक्स्ट पढ्ने काम भ्वाइसबक्सले गर्छ । यो सुविधाले विभिन्न भाषा बोल्ने दुई व्यक्तिबीचको सञ्चारलाई सहज र प्राकृतिक देखिने बनाउँछ । मोडेलको यो सुविधाको मद्दतले, स्पीचबाट गलत उच्चारण गरिएका शब्दहरू हटाउन सकिन्छ ।