चैटजीपीटी अब देख, सुन और बोल सकता है क्योंकि ओपनएआई ने आवाज और छवि सुविधाओं को रोल आउट करना शुरू कर दिया है


नई दिल्ली: ओपनएआई ने घोषणा की है कि वह अधिक सहज प्रकार के इंटरफ़ेस के लिए चैटजीपीटी में नई आवाज और छवि क्षमताओं को पेश कर रहा है। यह उपयोगकर्ताओं को ध्वनि वार्तालाप करने या चैटजीपीटी को दिखाने की अनुमति देगा कि वे किस बारे में बात कर रहे हैं। अब तक ChatGPT केवल टेक्स्ट फॉर्म तक ही सीमित है जहां आप केवल टेक्स्ट इनपुट में ही जानकारी दे सकते हैं।

ओपनएआई ब्लॉग में कहा गया है, “यात्रा करते समय किसी ऐतिहासिक स्थल की तस्वीर लें और उसमें क्या दिलचस्प है, उसके बारे में लाइव बातचीत करें।”

OpenAI चैटजीपीटी प्लस और एंटरप्राइज़ उपयोगकर्ताओं के लिए आने वाले दो सप्ताह में नया अपडेट जारी कर रहा है। वॉयस फीचर केवल आईओएस और एंड्रॉइड पर उपलब्ध होगा जबकि इमेज सभी प्लेटफॉर्म पर उपलब्ध होंगी।

फ़ोन में ध्वनि वार्तालाप कैसे प्रारंभ करें

चरण 1: आवाज के साथ आरंभ करने के लिए, मोबाइल ऐप पर सेटिंग्स → नई सुविधाओं पर जाएं और आवाज वार्तालाप का विकल्प चुनें।

चरण 2: फिर, होम स्क्रीन के ऊपरी-दाएं कोने में स्थित हेडफ़ोन बटन पर टैप करें और पांच अलग-अलग आवाज़ों में से अपनी पसंदीदा आवाज़ चुनें।

चरण 3: नई आवाज क्षमता एक नए टेक्स्ट-टू-स्पीच मॉडल द्वारा संचालित है, जो केवल टेक्स्ट और कुछ सेकंड के नमूना भाषण से मानव-जैसा ऑडियो उत्पन्न करने में सक्षम है।

चरण 4: हमने प्रत्येक आवाज़ बनाने के लिए पेशेवर आवाज़ अभिनेताओं के साथ सहयोग किया। हम आपके बोले गए शब्दों को पाठ में बदलने के लिए हमारे ओपन-सोर्स वाक् पहचान प्रणाली व्हिस्पर का भी उपयोग करते हैं।

छवियों के बारे में बातचीत करें

अब आप ChatGPT को एक या अधिक छवियाँ दिखा सकते हैं। समस्या का निवारण करें कि आपकी ग्रिल क्यों शुरू नहीं होगी, भोजन की योजना बनाने के लिए अपने फ्रिज की सामग्री का पता लगाएं, या काम से संबंधित डेटा के लिए एक जटिल ग्राफ का विश्लेषण करें। छवि के किसी विशिष्ट भाग पर ध्यान केंद्रित करने के लिए, आप हमारे मोबाइल ऐप में ड्राइंग टूल का उपयोग कर सकते हैं।

इमेज ऑप्शन कैसे शुरू करें

चरण 1: आरंभ करने के लिए, छवि खींचने या चुनने के लिए फोटो बटन पर टैप करें। यदि आप iOS या Android पर हैं, तो पहले प्लस बटन पर टैप करें।

चरण 2: आप कई छवियों पर भी चर्चा कर सकते हैं या अपने सहायक का मार्गदर्शन करने के लिए हमारे ड्राइंग टूल का उपयोग कर सकते हैं।

चरण 3: छवि समझ मल्टीमॉडल जीपीटी-3.5 और जीपीटी-4 द्वारा संचालित है। ये मॉडल अपने भाषा तर्क कौशल को छवियों की एक विस्तृत श्रृंखला पर लागू करते हैं, जैसे कि तस्वीरें, स्क्रीनशॉट और पाठ और छवि दोनों वाले दस्तावेज़।





Source link