कीवर्डहरू -

मेटाको नयाँ एआई स्पीच टुल सार्वजनिक, उच्च गुणस्तरको अडियो क्लिप उत्पादनमा सघाउने

मेटाको नयाँ एआई स्पीच टुल सार्वजनिक, उच्च गुणस्तरको अडियो क्लिप उत्पादनमा सघाउने

मेटाले प्रयोगकर्ताका लागि जेनेरेटिभ एआई स्पीच टुल ल्याएको छ । यो स्वीच भ्वाइसबक्सको नाममा सार्वजनिक भएको छ । मेटाको नयाँ एआई स्पीच टुललाई अघिल्लो मोडलहरूभन्दा फरक सुविधाहरूसहित ल्याइएको छ ।

भ्वाइसबक्सले विभिन्न शैलीहरूमा उच्च गुणस्तरको अडियो क्लिपहरू उत्पादन गर्न सक्छ । भ्वाइसबक्सको प्रयोगले प्रयोगकर्ताले इनपुटको लागि नयाँ र ताजा डाटा दिन सक्छन् ।

यस बाहेक, भ्वाइसबक्सले प्रयोगकर्ताहरूलाई पुराना नमूनाहरू परिमार्जन गर्न अनुमति समेत दिन्छ । मेटाको यो नयाँ एआई मोडल ६ भाषाको सपोर्टमा ल्याइएको छ । थप रूपमा, मोडेलले कंटेंट एडिटिंग स्टाइल कन्भर्सेशनद्वारा छुट्टै नमुना जेनेरेसन गर्दछ ।

मिडिया रिपोर्टका अनुसार मेटाको यो नयाँ एआई स्पीच मोडेल ५० हजार घण्टाको रेकर्डेड स्पीचको साथ तयार गरिएको छ । थप रूपमा, मोडेललाई विभिन्न भाषाहरूमा सार्वजनिक गरिएको डोमेन अडियोबुकहरू प्रयोग गरेर पनि तालिम दिइएको छ ।

मेटाको स्पीच मोडेल बोल्न नसक्ने प्रयोगकर्ताहरूको लागि विशेष मोडेल हो । मोडेलको टेक्स्ट टु स्पीच सुविधाको साथ, यसले स्पीच जेनेरेसन गर्न सक्छ ।

टेक्स्ट–टु–स्पीच सुविधाको साथ, मोडेलले दिइएको इनपुटसँग अडियो शैली मिलाउन प्रयास गर्छ, जस पछि टेक्सट–टू–स्पीच उत्पन्न हुन्छ । यो मोडल प्रयोगकर्ताका लागि भ्वाइस कस्टमाइजेसन सुविधाको साथ आउँछ ।

मोडललाई क्रस–लिङ्गुअल स्टाइल ट्रान्सफर फिचरसहित ल्याइएको छ । अंग्रेजी, फ्रेन्च, जर्मन, स्पेनिश, पोलिश र पोर्चुगिज भाषाहरूको साथ, प्रयोगकर्ताले भ्वाइस बक्समा स्पीच र टेक्सट इनपुट प्रदान गर्न सक्छ ।

दिइएको टेक्स्ट पढ्ने काम भ्वाइसबक्सले गर्छ । यो सुविधाले विभिन्न भाषा बोल्ने दुई व्यक्तिबीचको सञ्चारलाई सहज र प्राकृतिक देखिने बनाउँछ । मोडेलको यो सुविधाको मद्दतले, स्पीचबाट गलत उच्चारण गरिएका शब्दहरू हटाउन सकिन्छ ।