देखें: मार्क जुकरबर्ग ने गिटार बजाते हुए अपने पुराने वीडियो पर मेटा के नए एआई मॉडल का परीक्षण किया
वी-जेईपीए वीडियो जॉइंट एंबेडिंग प्रेडिक्टिव आर्किटेक्चर का संक्षिप्त रूप है।
मेटा के नवीनतम कृत्रिम बुद्धिमत्ता (एआई) मॉडल को बढ़ावा देने के प्रयास में, जो वीडियो देखकर सीखता है, मार्क जुकरबर्ग ने वी-जेईपीए नामक नई परियोजना का परिचय देते हुए एक पुराना वीडियो साझा किया। मिस्टर जुकरबर्ग ने इंस्टाग्राम पर एक पुरानी क्लिप साझा की, जिसमें वह अपनी बेटी मैक्सिमा के लिए गिटार पर गाना गाते और बजाते नजर आ रहे हैं। कैप्शन में, उन्होंने बताया कि उन्होंने एआई मॉडल वी-जेईपीए पर वीडियो का परीक्षण किया, जो कि इसकी साइट के अनुसार एक “गैर-जेनरेटिव मॉडल है जो एक अमूर्त प्रतिनिधित्व स्थान में वीडियो के लापता या नकाबपोश हिस्सों की भविष्यवाणी करके सीखता है”।
“मैक्स के पसंदीदा गीतों में से एक को गाने की पुरानी यादें। मैंने हाल ही में एक नए एआई मॉडल के साथ इस वीडियो का परीक्षण किया, जो वीडियो देखकर दुनिया के बारे में सीखता है। ऐसा करने के लिए प्रशिक्षित किए बिना, हमारे एआई मॉडल ने तारों को बजाते समय मेरे हाथ की गति की भविष्यवाणी की। पर स्वाइप करें परिणाम देखें,'' श्री जुकरबर्ग ने पोस्ट के कैप्शन में लिखा।
नीचे वीडियो देखें:
श्री ज़करबर्ग ने दो अलग-अलग वीडियो साझा किए। पहली क्लिप में वह मैक्सिमा के साथ गिटार पर गाना गाते और बजाते नजर आ रहे हैं। दूसरे वीडियो में, उन्होंने एआई मॉडल के परिणाम साझा किए, जिसमें दिखाया गया कि कैसे वी-जेईपीए ने गिटार बजाते समय उनके हाथों की गति की भविष्यवाणी की और वीडियो के छूटे हुए हिस्सों को खुद ही भर दिया।
श्री ज़करबर्ग ने एक दिन पहले ही वीडियो साझा किया था और तब से इसे 51,000 से अधिक लाइक्स मिल चुके हैं।
यह भी पढ़ें | एलेक्सी नवलनी से येवगेनी प्रिगोझिन तक, यहां पुतिन आलोचकों की एक सूची है जिनकी रहस्यमय तरीके से मृत्यु हो गई
विशेष रूप से, वी-जेईपीए, वीडियो जॉइंट एंबेडिंग प्रेडिक्टिव आर्किटेक्चर का संक्षिप्त रूप, एक पूर्वानुमानित विश्लेषण मॉडल है जो पूरी तरह से दृश्य मीडिया से सीखता है। यह न केवल समझ सकता है कि वीडियो में क्या चल रहा है, बल्कि यह भी भविष्यवाणी कर सकता है कि आगे क्या होगा।
इसे प्रशिक्षित करने के लिए, मेटा ने एक नई मास्किंग तकनीक का उपयोग करने का दावा किया है, जहां वीडियो के कुछ हिस्सों को समय और स्थान दोनों में छिपा दिया गया था, कंपनी ने एक में कहा ब्लॉग भेजा. इसका मतलब यह है कि वीडियो में कुछ फ़्रेम पूरी तरह से हटा दिए गए थे, जबकि कुछ अन्य फ़्रेमों में ब्लैक-आउट टुकड़े थे, जिसने मॉडल को वर्तमान फ़्रेम के साथ-साथ अगले फ़्रेम दोनों की भविष्यवाणी करने के लिए मजबूर किया। कंपनी के अनुसार, मॉडल दोनों कार्य कुशलता से करने में सक्षम था। विशेष रूप से, मॉडल 10 सेकंड तक के वीडियो की भविष्यवाणी और विश्लेषण कर सकता है।
“उदाहरण के लिए, यदि मॉडल को किसी के पेन डालने, पेन उठाने और पेन डालने का नाटक करने, लेकिन वास्तव में ऐसा नहीं करने के बीच अंतर करने में सक्षम होने की आवश्यकता है, तो वी-जेईपीए इसके लिए पिछले तरीकों की तुलना में काफी अच्छा है। हाई-ग्रेड एक्शन रिकग्निशन कार्य, “मेटा ने एक ब्लॉग पोस्ट में कहा।