ओपनएआई नए एआई टूल का परीक्षण कर रहा है जो 15 सेकंड के ऑडियो नमूनों के साथ मानव आवाज को क्लोन कर सकता है
नई दिल्ली: चैटजीपीटी-निर्माता ओपनएआई वॉयस इंजन नामक एक नए टूल पर काम कर रहा है। एआई-संचालित वॉयस इंजन केवल 15 सेकंड में आवाज के नमूने का विश्लेषण और क्लोन कर सकता है।
नवीनतम एआई टूल इतनी कम अवधि तक सुनने के बाद आवाज को सटीक रूप से उत्पन्न कर सकता है। हालाँकि, सिंथेटिक आवाज़ों के संभावित दुरुपयोग की चिंताओं के कारण OpenAI इसकी व्यापक रिलीज़ को लेकर सतर्क है।
इस एआई टूल का प्राथमिक लक्ष्य पाठ को जोर से पढ़ने के लिए जीवंत आवाजें उत्पन्न करके पढ़ने में कठिनाई वाले व्यक्तियों, जिनमें बच्चे भी शामिल हैं, की सहायता करना है। एज ऑफ लर्निंग जैसी कंपनियां शैक्षिक सामग्री विकसित करने के लिए इस तकनीक का उपयोग करती हैं।
हम वॉयस इंजन के एक छोटे पैमाने के पूर्वावलोकन से अपनी सीख साझा कर रहे हैं, एक मॉडल जो प्राकृतिक-ध्वनि भाषण उत्पन्न करने के लिए टेक्स्ट इनपुट और एक 15-सेकंड ऑडियो नमूना का उपयोग करता है जो मूल स्पीकर से काफी मिलता-जुलता है। https://t.co/yLsfGaVtrZ– ओपनएआई (@OpenAI) 29 मार्च 2024
यह टूल मूल वक्ता की आवाज़ को बरकरार रखते हुए वीडियो और पॉडकास्ट का विभिन्न भाषाओं में अनुवाद कर सकता है, जिससे यह वैश्विक दर्शकों के साथ जुड़ने के लिए मूल्यवान हो जाता है। (यह भी पढ़ें: व्हाट्सएप ने एंड्रॉइड यूजर्स के लिए नया फीचर रोल आउट करना शुरू किया)
इसके फायदों के बावजूद, इसके दुरुपयोग की चिंताएं हैं, खासकर चुनावी मौसम के दौरान। ओपनएआई का कहना है कि वह इस बारे में और अधिक शोध करना चाहता है कि वह इस तरह के उपकरणों को गलत सूचना फैलाने और सहमति के बिना आवाजों की नकल करने से कैसे बचा सकता है।
कंपनी द्वारा एक ब्लॉग पोस्ट में कहा गया है, “हम मानते हैं कि लोगों की आवाज़ से मिलता-जुलता भाषण उत्पन्न करने में गंभीर जोखिम होते हैं, जो विशेष रूप से चुनावी वर्ष में दिमाग में सबसे ऊपर होते हैं।” , मीडिया, मनोरंजन, शिक्षा, नागरिक समाज और उससे आगे यह सुनिश्चित करने के लिए कि हम निर्माण करते समय उनकी प्रतिक्रिया को शामिल कर रहे हैं।
Spotify ने लेक्स फ्रिडमैन जैसे प्रसिद्ध होस्ट द्वारा पॉडकास्ट का अनुवाद करने के लिए अपने पायलट कार्यक्रम में इस तकनीक का लाभ उठाया है। ओपनएआई ने अतिरिक्त उपयोगों पर प्रकाश डाला, जिसमें बच्चों की शैक्षिक सामग्री के लिए आवाज विकल्पों का विस्तार भी शामिल है। (यह भी पढ़ें: एक्स पर वायरल ट्रेंड: 'यहां क्लिक करें' फीचर क्या है; बीजेपी और आप शामिल हो गए)
ओपनएआई ने 2022 के अंत में वॉयस इंजन विकास शुरू किया। तकनीक ने पहले से ही टेक्स्ट-टू-स्पीच एपीआई और चैटजीपीटी के रीड अलाउड फीचर के लिए प्रीसेट वॉयस को संचालित किया है।