जनरेटिव डेटा इंटेलिजेंस

माइक्रोसॉफ्ट के इमेज टू वीडियो टूल से प्रभावित हुए उपयोगकर्ता - वीएएसए-

दिनांक:

जैसे-जैसे एआई वर्चस्व की दौड़ जारी है, माइक्रोसॉफ्ट अब अपने नवीनतम टूल वीएएसए-1 के साथ लोगों की पोर्ट्रेट तस्वीरों को बात करने वाले चेहरों या वीडियो में बदलना चाहता है।

टेक दिग्गज के एक शोध पत्र के अनुसार, माइक्रोसॉफ्ट एआई की दौड़ को दूसरे स्तर पर ले जा रहा है वासा 1, दृश्य प्रभावशाली कौशल (वीएएस) के साथ आभासी पात्रों के जीवंत बात करने वाले चेहरे बनाने के लिए रूपरेखा, सभी एक चित्र से।

यह भी पढ़ें: वीडियो गेम उद्योग एआई पर एकजुट होने की होड़ में है

तस्वीरों से लेकर बात करने वाले चेहरों तक

हालाँकि यह अभी तक जनता के लिए उपलब्ध नहीं है, यह टूल एक एकल पोर्ट्रेट फोटो और भाषण ऑडियो लेता है और सटीक लिप-ऑडियो सिंक, जीवंत चेहरे के व्यवहार और वास्तविक समय में उत्पन्न प्राकृतिक सिर आंदोलनों के साथ एक हाइपर-यथार्थवादी बात करने वाला वीडियो तैयार करता है।

यह टूल अभी भी माइक्रोसॉफ्ट रिसर्च टीम के साथ अनुसंधान पूर्वावलोकन चरण में है, और डेमो वीडियो "प्रभावशाली दिखते हैं।"

जबकि एनवीडिया और रनवे जैसी कंपनियों के पास पहले से ही समान हेड मूवमेंट और लिप सिंक तकनीक है, वीएएसए -1 "बहुत उच्च गुणवत्ता और यथार्थवाद का प्रतीत होता है", जो मुंह की कलाकृतियों को कम करता है, के अनुसार टॉम गाइड.

इसके अतिरिक्त, ऑडियो संचालित एनीमेशन का यह दृष्टिकोण भी हाल ही जैसा है व्लॉगर एआई गूगल रिसर्च द्वारा मॉडल.

माइक्रोसॉफ्ट के अनुसार, जबकि प्रदर्शन उदाहरणों में सभी छवियां Dall-E द्वारा बनाई गई सिंथेटिक हैं, VASA-1 अभी भी एक वास्तविक तस्वीर को एनिमेट कर सकता है।

डेमो में अलग-अलग लोगों को लगभग प्राकृतिक गतिविधियों, चेहरे के भाव, आंखों की गतिविधियों के साथ बात करते हुए दिखाया गया है "अन्य उपकरणों में मुंह के ऊपर और नीचे के आसपास कोई कलाकृति नहीं देखी गई है।"

इसे काम करने के लिए फेस-फ़ॉरवर्ड पोर्ट्रेट शैली छवि की भी आवश्यकता नहीं है।

VASA-1 ने लोगों को बात करने के लिए प्रेरित किया

पहले से ही, एआई उत्साही लोग एक्स प्लेटफॉर्म पर इसे "जंगली" और "पागल" बताने वाली तकनीक से प्रभावित हैं।

"प्रत्येक रिलीज़ के बीच हमें जो सुधार मिल रहे हैं वह अविश्वसनीय है," कहा लिनस एकेनस्टाम.

अन्य लोगों का विचार है कि दुनिया "मीडिया सामग्री के निर्माण के तरीके" और इसके उपभोग के तरीके में बड़ा बदलाव देख रही है।

सैम नामक एक अन्य उत्साही ने कहा, "यह आश्चर्यजनक है, यथार्थवाद शीर्ष पायदान पर है।"

हालाँकि अन्य लोग टूल की क्षमताओं को पहचानते हैं, लेकिन वे यह भी सोचते हैं कि Microsoft की ओर से एक ऐसा टूल पेश करना थोड़ा गैर-जिम्मेदाराना है जिसे आसानी से उपयोग के लिए हेरफेर किया जा सकता है। चुनाव डीपफेक.

"चुनाव से ठीक पहले इसे छोड़ना उचित नहीं होगा," लिखा था एक्स प्लेटफॉर्म पर रोवन चेउंग।

एक अन्य उपयोगकर्ता इवान कर्स्टेल सख्त चेतावनी के साथ टिप्पणी की गई: "माइक्रोसॉफ्ट रिसर्च का VASA-1 एक गेम-चेंजर है, जो सिर्फ एक फोटो और ऑडियो से हाइपर-यथार्थवादी AI-जनरेटेड वीडियो बनाता है।"

“क्लासिक सिनेमा के दिग्गजों को पुनर्जीवित करने से लेकर वैयक्तिकृत मीडिया तक संभावनाएं अनंत हैं। लेकिन आइए डीपफेक जोखिमों के प्रति सचेत रहें।”

पहले से ही, दुनिया ने चुनावी डीपफेक की बाढ़ देखी है जहां प्रचार फैलाने के लिए एआई का उपयोग करके राजनेताओं की आवाज़ या छवियों में हेरफेर किया गया है। वैश्विक आबादी का लगभग एक तिहाई हिस्सा इस वर्ष चुनाव में जा रहा है।

हालाँकि, Microsoft के शोधकर्ताओं ने संकेत दिया है कि यह केवल प्रदर्शन के लिए है और वर्तमान में सार्वजनिक रिलीज़ या इसे डेवलपर्स के लिए उपलब्ध कराने की कोई योजना नहीं है।

वीएएसए-1 कैसे काम करता है?

टॉम की गाइड के अनुसार, शोधकर्ता खुद मॉडल की "एक गाने पर पूरी तरह से लिप-सिंक करने की क्षमता से आश्चर्यचकित हैं, जो प्रशिक्षण डेटासेट में किसी भी संगीत का उपयोग नहीं किए जाने के बावजूद गायक के शब्दों को बिना किसी समस्या के प्रतिबिंबित करता है।"

इसके अतिरिक्त, VASA-1 ने प्रसिद्ध जैसे ऐतिहासिक चित्रों सहित विभिन्न छवि शैलियों को संभाला मोना लिसा.

इस टूल का उपयोग इसकी उन्नत लिप-सिंक क्षमताओं के आधार पर गेमिंग में किया जा सकता है। विशेषज्ञों ने कहा है कि यह विसर्जन के लिए गेम चेंजर हो सकता है।

इसके अतिरिक्त, तकनीक सोशल मीडिया वीडियो के लिए अवतार बनाने में सहायक हो सकती है, जैसा कि सिंथेसिया और हेजेन जैसी कंपनियों के मामले में होता है।

एआई-आधारित फिल्में और संगीत वीडियो निर्माण भी अधिक यथार्थवादी वीडियो के लिए वीएएसए-1 तकनीक का लाभ उठा सकते हैं।

संभावना है कि OpenAI में Microsoft की हिस्सेदारी होने के कारण, VASA-1 "भविष्य के सह-पायलट" का हिस्सा हो सकता है सोरा एकीकरण।"

स्पॉट_आईएमजी

नवीनतम खुफिया

स्पॉट_आईएमजी

हमारे साथ चैट करें

नमस्ते! मैं आपकी कैसे मदद कर सकता हूँ?