जैसे-जैसे एआई वर्चस्व की दौड़ जारी है, माइक्रोसॉफ्ट अब अपने नवीनतम टूल वीएएसए-1 के साथ लोगों की पोर्ट्रेट तस्वीरों को बात करने वाले चेहरों या वीडियो में बदलना चाहता है।
टेक दिग्गज के एक शोध पत्र के अनुसार, माइक्रोसॉफ्ट एआई की दौड़ को दूसरे स्तर पर ले जा रहा है वासा 1, दृश्य प्रभावशाली कौशल (वीएएस) के साथ आभासी पात्रों के जीवंत बात करने वाले चेहरे बनाने के लिए रूपरेखा, सभी एक चित्र से।
यह भी पढ़ें: वीडियो गेम उद्योग एआई पर एकजुट होने की होड़ में है
तस्वीरों से लेकर बात करने वाले चेहरों तक
हालाँकि यह अभी तक जनता के लिए उपलब्ध नहीं है, यह टूल एक एकल पोर्ट्रेट फोटो और भाषण ऑडियो लेता है और सटीक लिप-ऑडियो सिंक, जीवंत चेहरे के व्यवहार और वास्तविक समय में उत्पन्न प्राकृतिक सिर आंदोलनों के साथ एक हाइपर-यथार्थवादी बात करने वाला वीडियो तैयार करता है।
यह टूल अभी भी माइक्रोसॉफ्ट रिसर्च टीम के साथ अनुसंधान पूर्वावलोकन चरण में है, और डेमो वीडियो "प्रभावशाली दिखते हैं।"
जबकि एनवीडिया और रनवे जैसी कंपनियों के पास पहले से ही समान हेड मूवमेंट और लिप सिंक तकनीक है, वीएएसए -1 "बहुत उच्च गुणवत्ता और यथार्थवाद का प्रतीत होता है", जो मुंह की कलाकृतियों को कम करता है, के अनुसार टॉम गाइड.
इसके अतिरिक्त, ऑडियो संचालित एनीमेशन का यह दृष्टिकोण भी हाल ही जैसा है व्लॉगर एआई गूगल रिसर्च द्वारा मॉडल.
माइक्रोसॉफ्ट के अनुसार, जबकि प्रदर्शन उदाहरणों में सभी छवियां Dall-E द्वारा बनाई गई सिंथेटिक हैं, VASA-1 अभी भी एक वास्तविक तस्वीर को एनिमेट कर सकता है।
डेमो में अलग-अलग लोगों को लगभग प्राकृतिक गतिविधियों, चेहरे के भाव, आंखों की गतिविधियों के साथ बात करते हुए दिखाया गया है "अन्य उपकरणों में मुंह के ऊपर और नीचे के आसपास कोई कलाकृति नहीं देखी गई है।"
इसे काम करने के लिए फेस-फ़ॉरवर्ड पोर्ट्रेट शैली छवि की भी आवश्यकता नहीं है।
माइक्रोसॉफ्ट ने अभी VASA-1 पेश किया है।
यह एक नया एआई मॉडल है जो 1 फोटो और 1 ऑडियो को पूरी तरह से जीवंत मानव डीपफेक में बदल सकता है।
चुनाव से ठीक पहले इसे छोड़ना बेतुका हैpic.twitter.com/MuLkZVOKRM
- रोवन चेउंग (@rowancheung) अप्रैल १, २०२४
VASA-1 ने लोगों को बात करने के लिए प्रेरित किया
पहले से ही, एआई उत्साही लोग एक्स प्लेटफॉर्म पर इसे "जंगली" और "पागल" बताने वाली तकनीक से प्रभावित हैं।
"प्रत्येक रिलीज़ के बीच हमें जो सुधार मिल रहे हैं वह अविश्वसनीय है," कहा लिनस एकेनस्टाम.
अन्य लोगों का विचार है कि दुनिया "मीडिया सामग्री के निर्माण के तरीके" और इसके उपभोग के तरीके में बड़ा बदलाव देख रही है।
सैम नामक एक अन्य उत्साही ने कहा, "यह आश्चर्यजनक है, यथार्थवाद शीर्ष पायदान पर है।"
हालाँकि अन्य लोग टूल की क्षमताओं को पहचानते हैं, लेकिन वे यह भी सोचते हैं कि Microsoft की ओर से एक ऐसा टूल पेश करना थोड़ा गैर-जिम्मेदाराना है जिसे आसानी से उपयोग के लिए हेरफेर किया जा सकता है। चुनाव डीपफेक.
"चुनाव से ठीक पहले इसे छोड़ना उचित नहीं होगा," लिखा था एक्स प्लेटफॉर्म पर रोवन चेउंग।
एक अन्य उपयोगकर्ता इवान कर्स्टेल सख्त चेतावनी के साथ टिप्पणी की गई: "माइक्रोसॉफ्ट रिसर्च का VASA-1 एक गेम-चेंजर है, जो सिर्फ एक फोटो और ऑडियो से हाइपर-यथार्थवादी AI-जनरेटेड वीडियो बनाता है।"
“क्लासिक सिनेमा के दिग्गजों को पुनर्जीवित करने से लेकर वैयक्तिकृत मीडिया तक संभावनाएं अनंत हैं। लेकिन आइए डीपफेक जोखिमों के प्रति सचेत रहें।”
पहले से ही, दुनिया ने चुनावी डीपफेक की बाढ़ देखी है जहां प्रचार फैलाने के लिए एआई का उपयोग करके राजनेताओं की आवाज़ या छवियों में हेरफेर किया गया है। वैश्विक आबादी का लगभग एक तिहाई हिस्सा इस वर्ष चुनाव में जा रहा है।
हालाँकि, Microsoft के शोधकर्ताओं ने संकेत दिया है कि यह केवल प्रदर्शन के लिए है और वर्तमान में सार्वजनिक रिलीज़ या इसे डेवलपर्स के लिए उपलब्ध कराने की कोई योजना नहीं है।
वीएएसए-1 कैसे काम करता है?
टॉम की गाइड के अनुसार, शोधकर्ता खुद मॉडल की "एक गाने पर पूरी तरह से लिप-सिंक करने की क्षमता से आश्चर्यचकित हैं, जो प्रशिक्षण डेटासेट में किसी भी संगीत का उपयोग नहीं किए जाने के बावजूद गायक के शब्दों को बिना किसी समस्या के प्रतिबिंबित करता है।"
इसके अतिरिक्त, VASA-1 ने प्रसिद्ध जैसे ऐतिहासिक चित्रों सहित विभिन्न छवि शैलियों को संभाला मोना लिसा.
इस टूल का उपयोग इसकी उन्नत लिप-सिंक क्षमताओं के आधार पर गेमिंग में किया जा सकता है। विशेषज्ञों ने कहा है कि यह विसर्जन के लिए गेम चेंजर हो सकता है।
इसके अतिरिक्त, तकनीक सोशल मीडिया वीडियो के लिए अवतार बनाने में सहायक हो सकती है, जैसा कि सिंथेसिया और हेजेन जैसी कंपनियों के मामले में होता है।
एआई-आधारित फिल्में और संगीत वीडियो निर्माण भी अधिक यथार्थवादी वीडियो के लिए वीएएसए-1 तकनीक का लाभ उठा सकते हैं।
संभावना है कि OpenAI में Microsoft की हिस्सेदारी होने के कारण, VASA-1 "भविष्य के सह-पायलट" का हिस्सा हो सकता है सोरा एकीकरण।"
- एसईओ संचालित सामग्री और पीआर वितरण। आज ही प्रवर्धित हो जाओ।
- प्लेटोडेटा.नेटवर्क वर्टिकल जेनरेटिव एआई। स्वयं को शक्तिवान बनाएं। यहां पहुंचें।
- प्लेटोआईस्ट्रीम। Web3 इंटेलिजेंस। ज्ञान प्रवर्धित। यहां पहुंचें।
- प्लेटोईएसजी. कार्बन, क्लीनटेक, ऊर्जा, पर्यावरण, सौर, कचरा प्रबंधन। यहां पहुंचें।
- प्लेटोहेल्थ। बायोटेक और क्लिनिकल परीक्षण इंटेलिजेंस। यहां पहुंचें।
- स्रोत: https://metanews.com/enthusiasts-smitten-by-image-to-video-tool-vasa-1/