ओपनएआई ने सोरा का अनावरण किया: जटिल दृश्यों को उत्पन्न करने के लिए एक गेम-चेंजिंग टेक्स्ट-टू-वीडियो मॉडल | – टाइम्स ऑफ इंडिया



लॉन्च के लगभग 15 महीने बाद इसका गेम चेंज हो गया भाषा मॉडल चैटजीपीटी, ओपनएआई ने एक और खुलासा किया है एआई उपकरण: सोरा. “सोरा का परिचय, हमारा टेक्स्ट-टू-वीडियो मॉडल. सोरा ओपनएआई ने नए टूल के बारे में कहा, दृश्य गुणवत्ता और उपयोगकर्ता के संकेत का पालन बनाए रखते हुए एक मिनट तक के वीडियो तैयार कर सकते हैं।
सोरा क्या कर सकती है?
ओपनएआई के अनुसार, सोरा कई पात्रों, विशिष्ट प्रकार की गति और विषय और पृष्ठभूमि के सटीक विवरण के साथ जटिल दृश्य उत्पन्न करने में सक्षम है। “मॉडल न केवल समझता है कि उपयोगकर्ता ने प्रॉम्प्ट में क्या मांगा है, बल्कि यह भी समझता है कि वे चीजें कैसे हैं भौतिक दुनिया में मौजूद हैं, ”कंपनी ने कहा। इसके अलावा, मॉडल को भाषा की गहरी समझ है, जो इसे संकेतों की सटीक व्याख्या करने और जीवंत भावनाओं को व्यक्त करने वाले सम्मोहक चरित्र उत्पन्न करने में सक्षम बनाता है। ओपनएआई ने कहा कि सोरा एक ही जेनरेट किए गए वीडियो के भीतर कई शॉट भी बना सकता है जो पात्रों और दृश्य शैली को सटीक रूप से बनाए रखता है।
ओपनएआई ने स्वीकार किया है कि मॉडल पूरी तरह से तैयार नहीं है और इसमें कुछ कमजोरियां हैं। यह एक जटिल दृश्य की भौतिकी का सटीक अनुकरण करने में संघर्ष कर सकता है, और कारण और प्रभाव के विशिष्ट उदाहरणों को नहीं समझ सकता है। उदाहरण के लिए, कोई व्यक्ति कुकी से एक टुकड़ा काट सकता है, लेकिन बाद में, कुकी पर काटने का कोई निशान नहीं हो सकता है। इसके अलावा, मॉडल किसी प्रॉम्प्ट के स्थानिक विवरण को भी भ्रमित कर सकता है, उदाहरण के लिए, बाएँ और दाएँ को मिलाना, और समय के साथ होने वाली घटनाओं के सटीक विवरण के साथ संघर्ष कर सकता है, जैसे कि एक विशिष्ट कैमरा प्रक्षेपवक्र का अनुसरण करना, OpenAI ने चेतावनी दी है।
चैटजीपीटी निर्माता ने सुरक्षा पहलू पर भी जोर दिया है। “कंपनी गलत सूचना, घृणित सामग्री और पूर्वाग्रह जैसे क्षेत्रों में डोमेन विशेषज्ञों को काम पर रखेगी, जो मॉडल का प्रतिकूल परीक्षण करेंगे। “हम दुनिया भर के नीति निर्माताओं, शिक्षकों और कलाकारों को उनकी चिंताओं को समझने और इस नई तकनीक के सकारात्मक उपयोग के मामलों की पहचान करने के लिए शामिल करेंगे। व्यापक शोध और परीक्षण के बावजूद, हम उन सभी लाभकारी तरीकों की भविष्यवाणी नहीं कर सकते हैं जिनका लोग हमारी तकनीक का उपयोग करेंगे, न ही उन सभी तरीकों का अनुमान लगा सकते हैं जिनका लोग इसका दुरुपयोग करेंगे, ”कंपनी ने कहा।





Source link