Üretken Veri Zekası

Microsoft'un Görüntüden Videoya Aktarma Aracı – VASA-'ya Etkilenen Kullanıcılar

Tarih:

Yapay zeka üstünlüğü yarışı devam ederken Microsoft artık en son aracı VASA-1 ile insanların portre resimlerini konuşan yüzlere veya videolara dönüştürmek istiyor.

Teknoloji devi tarafından hazırlanan bir araştırma makalesine göre Microsoft, yapay zeka yarışını başka bir seviyeye taşıyor. VASA 1, tümü bir portreden olmak üzere, görsel duygusal becerilere (VAS) sahip sanal karakterlerin gerçeğe yakın konuşan yüzlerini oluşturmaya yönelik çerçeve.

Ayrıca okuyun: Video Oyun Sektörü Yapay Zeka Üzerinden Sendikalaşmaya Acele Ediyor

Portrelerden konuşan yüzlere

Henüz kamuya açık olmasa da araç, tek bir portre fotoğrafı ve konuşma sesi çekiyor ve hassas dudak-ses senkronizasyonu, gerçeğe yakın yüz davranışı ve gerçek zamanlı olarak oluşturulan doğal kafa hareketleri ile hiper gerçekçi bir konuşan yüz videosu üretiyor.

Araç, Microsoft Araştırma ekibiyle hâlâ araştırma ön izleme aşamasındadır ve demo videoları "etkileyici görünüyor."

Nvidia ve Runway gibi şirketler zaten benzer kafa hareketi ve dudak senkronizasyonu teknolojisine sahip olsa da, VASA-1 "çok daha kaliteli ve gerçekçi" görünüyor ve bu da ağız yapılarını azaltıyor. Tom's Guide.

Ek olarak, ses odaklı animasyona yönelik bu yaklaşım da son zamanlardaki yaklaşımlara benzemektedir. Vlogger yapay zekası Google Araştırma modeli.

Microsoft'a göre, gösteri örneklerindeki tüm görseller Dall-E tarafından oluşturulmuş sentetik olsa da, VASA-1 yine de gerçek bir resmi canlandırabiliyor.

Demo, farklı insanların neredeyse doğal hareketlerle, yüz ifadeleriyle, göz hareketleriyle konuştuğunu gösteriyor; "diğer araçlarda görülen ağzın üst ve alt kısmında herhangi bir eser yok."

Ayrıca çalışması için yüzü ileriye dönük portre tarzı bir görüntüye ihtiyaç duymaz.

VASA-1 insanları konuşturdu

Yapay zeka meraklıları, X platformunda onu "çılgın" ve "çılgın" olarak tanımlayan teknolojiye şimdiden aşık olmuş görünüyor.

"Her sürüm arasında elde ettiğimiz gelişmeler inanılmaz" şuraya Linus Ekenstam.

Diğerleri ise dünyanın “medya içeriğinin yaratılma ve tüketilme biçiminde sismik bir değişime” tanık olduğu görüşünde.

Sam olarak tanımlanan başka bir meraklı, "Bu akıllara durgunluk veren bir şey, gerçekçilik birinci sınıf" dedi.

Diğerleri aracın yeteneklerinin farkında olsalar da, Microsoft'un kolaylıkla manipüle edilebilecek bir araç sunmanın biraz sorumsuz olduğunu düşünüyorlar. seçim deepfake'leri.

“Seçimlerden hemen önce bunu bırakmak çılgınca” yazdı Rowan Cheung X platformunda.

Başka kullanıcı Evan Kirstel sert bir uyarıyla şu yorumu yaptı: "Microsoft Research'ün VASA-1'i, yalnızca bir fotoğraf ve sesten yapay zeka tarafından oluşturulan hiper gerçekçi videolar yaratan, oyunun kurallarını değiştiren bir ürün."

“Klasik sinema efsanelerini yeniden canlandırmaktan kişiselleştirilmiş medyaya kadar olasılıklar sonsuzdur. Ancak deepfake risklerine karşı tetikte olalım.”

Zaten dünya, propaganda yaymak için politikacıların seslerinin veya görüntülerinin yapay zeka kullanılarak manipüle edildiği seçim deepfakelerinin akınına tanık oldu. Dünya nüfusunun yaklaşık üçte biri bu yıl sandık başına gidiyor.

Ancak Microsoft'taki araştırmacılar bunun yalnızca tanıtım amaçlı olduğunu ve şu anda kamuya açıklanması veya geliştiricilerin kullanımına sunulmasına yönelik herhangi bir planın bulunmadığını belirtti.

VASA-1 nasıl çalışır?

Tom's Guide'a göre araştırmacılar, modelin "eğitim veri setinde hiçbir müzik kullanılmamasına rağmen şarkıcının sözlerini sorunsuz bir şekilde yansıtarak bir şarkıyla mükemmel bir şekilde dudak senkronizasyonu yapabilme" becerisine şaşırdılar.

Ayrıca VASA-1, ünlü portreler gibi tarihi portreler de dahil olmak üzere farklı görüntü stillerini ele aldı. Mona Lisa.

Araç, gelişmiş dudak senkronizasyonu yetenekleri sayesinde oyun oynarken kullanılabilir. Uzmanlar bunun, oyunun içine dalma konusunda oyunun kurallarını değiştirebileceğini söylüyor.

Ek olarak teknoloji, Synthesia ve HeyGen gibi firmalarda olduğu gibi sosyal medya videoları için avatarlar oluşturmada da etkili olabilir.

Yapay zeka tabanlı filmler ve müzik videosu prodüksiyonları da daha gerçekçi videolar için VASA-1 teknolojisinden yararlanabilir.

Microsoft'un OpenAI'de hisseye sahip olmasıyla VASA-1'in "gelecekteki Yardımcı Pilot"un parçası olma ihtimali var Sora entegrasyon.”

spot_img

En Son İstihbarat

spot_img

Bizimle sohbet

Merhaba! Size nasıl yardım edebilirim?