Yapay zeka üstünlüğü yarışı devam ederken Microsoft artık en son aracı VASA-1 ile insanların portre resimlerini konuşan yüzlere veya videolara dönüştürmek istiyor.
Teknoloji devi tarafından hazırlanan bir araştırma makalesine göre Microsoft, yapay zeka yarışını başka bir seviyeye taşıyor. VASA 1, tümü bir portreden olmak üzere, görsel duygusal becerilere (VAS) sahip sanal karakterlerin gerçeğe yakın konuşan yüzlerini oluşturmaya yönelik çerçeve.
Ayrıca okuyun: Video Oyun Sektörü Yapay Zeka Üzerinden Sendikalaşmaya Acele Ediyor
Portrelerden konuşan yüzlere
Henüz kamuya açık olmasa da araç, tek bir portre fotoğrafı ve konuşma sesi çekiyor ve hassas dudak-ses senkronizasyonu, gerçeğe yakın yüz davranışı ve gerçek zamanlı olarak oluşturulan doğal kafa hareketleri ile hiper gerçekçi bir konuşan yüz videosu üretiyor.
Araç, Microsoft Araştırma ekibiyle hâlâ araştırma ön izleme aşamasındadır ve demo videoları "etkileyici görünüyor."
Nvidia ve Runway gibi şirketler zaten benzer kafa hareketi ve dudak senkronizasyonu teknolojisine sahip olsa da, VASA-1 "çok daha kaliteli ve gerçekçi" görünüyor ve bu da ağız yapılarını azaltıyor. Tom's Guide.
Ek olarak, ses odaklı animasyona yönelik bu yaklaşım da son zamanlardaki yaklaşımlara benzemektedir. Vlogger yapay zekası Google Araştırma modeli.
Microsoft'a göre, gösteri örneklerindeki tüm görseller Dall-E tarafından oluşturulmuş sentetik olsa da, VASA-1 yine de gerçek bir resmi canlandırabiliyor.
Demo, farklı insanların neredeyse doğal hareketlerle, yüz ifadeleriyle, göz hareketleriyle konuştuğunu gösteriyor; "diğer araçlarda görülen ağzın üst ve alt kısmında herhangi bir eser yok."
Ayrıca çalışması için yüzü ileriye dönük portre tarzı bir görüntüye ihtiyaç duymaz.
Microsoft kısa süre önce VASA-1'i tanıttı.
Bu, 1 fotoğrafı ve 1 parça sesi tamamen gerçekçi bir insan deepfake'ine dönüştürebilen yeni bir yapay zeka modelidir.
Seçimden hemen önce bunu bırakmak çılgınca 😬pic.twitter.com/MuLkZVOKRM
— Rowan Cheung (@rowancheung) 18 Nisan 2024
VASA-1 insanları konuşturdu
Yapay zeka meraklıları, X platformunda onu "çılgın" ve "çılgın" olarak tanımlayan teknolojiye şimdiden aşık olmuş görünüyor.
"Her sürüm arasında elde ettiğimiz gelişmeler inanılmaz" şuraya Linus Ekenstam.
Diğerleri ise dünyanın “medya içeriğinin yaratılma ve tüketilme biçiminde sismik bir değişime” tanık olduğu görüşünde.
Sam olarak tanımlanan başka bir meraklı, "Bu akıllara durgunluk veren bir şey, gerçekçilik birinci sınıf" dedi.
Diğerleri aracın yeteneklerinin farkında olsalar da, Microsoft'un kolaylıkla manipüle edilebilecek bir araç sunmanın biraz sorumsuz olduğunu düşünüyorlar. seçim deepfake'leri.
“Seçimlerden hemen önce bunu bırakmak çılgınca” yazdı Rowan Cheung X platformunda.
Başka kullanıcı Evan Kirstel sert bir uyarıyla şu yorumu yaptı: "Microsoft Research'ün VASA-1'i, yalnızca bir fotoğraf ve sesten yapay zeka tarafından oluşturulan hiper gerçekçi videolar yaratan, oyunun kurallarını değiştiren bir ürün."
“Klasik sinema efsanelerini yeniden canlandırmaktan kişiselleştirilmiş medyaya kadar olasılıklar sonsuzdur. Ancak deepfake risklerine karşı tetikte olalım.”
Zaten dünya, propaganda yaymak için politikacıların seslerinin veya görüntülerinin yapay zeka kullanılarak manipüle edildiği seçim deepfakelerinin akınına tanık oldu. Dünya nüfusunun yaklaşık üçte biri bu yıl sandık başına gidiyor.
Ancak Microsoft'taki araştırmacılar bunun yalnızca tanıtım amaçlı olduğunu ve şu anda kamuya açıklanması veya geliştiricilerin kullanımına sunulmasına yönelik herhangi bir planın bulunmadığını belirtti.
VASA-1 nasıl çalışır?
Tom's Guide'a göre araştırmacılar, modelin "eğitim veri setinde hiçbir müzik kullanılmamasına rağmen şarkıcının sözlerini sorunsuz bir şekilde yansıtarak bir şarkıyla mükemmel bir şekilde dudak senkronizasyonu yapabilme" becerisine şaşırdılar.
Ayrıca VASA-1, ünlü portreler gibi tarihi portreler de dahil olmak üzere farklı görüntü stillerini ele aldı. Mona Lisa.
Araç, gelişmiş dudak senkronizasyonu yetenekleri sayesinde oyun oynarken kullanılabilir. Uzmanlar bunun, oyunun içine dalma konusunda oyunun kurallarını değiştirebileceğini söylüyor.
Ek olarak teknoloji, Synthesia ve HeyGen gibi firmalarda olduğu gibi sosyal medya videoları için avatarlar oluşturmada da etkili olabilir.
Yapay zeka tabanlı filmler ve müzik videosu prodüksiyonları da daha gerçekçi videolar için VASA-1 teknolojisinden yararlanabilir.
Microsoft'un OpenAI'de hisseye sahip olmasıyla VASA-1'in "gelecekteki Yardımcı Pilot"un parçası olma ihtimali var Sora entegrasyon.”
- SEO Destekli İçerik ve Halkla İlişkiler Dağıtımı. Bugün Gücünüzü Artırın.
- PlatoData.Network Dikey Üretken Yapay Zeka. Kendine güç ver. Buradan Erişin.
- PlatoAiStream. Web3 Zekası. Bilgi Genişletildi. Buradan Erişin.
- PlatoESG. karbon, temiz teknoloji, Enerji, Çevre, Güneş, Atık Yönetimi. Buradan Erişin.
- PlatoSağlık. Biyoteknoloji ve Klinik Araştırmalar Zekası. Buradan Erişin.
- Kaynak: https://metanews.com/enthusiasts-smitten-by-image-to-video-tool-vasa-1/