Generatiivne andmeluure

Microsofti pildist videoks tööriistast vaimustunud kasutajad – VASA-

kuupäev:

Kuna võidujooks AI ülemvõimu pärast jätkub, soovib Microsoft oma uusima tööriista VASA-1 abil muuta inimeste portreepildid kõnelevateks nägudeks või videoteks.

Tehnikahiiglase uurimistöö kohaselt viib Microsoft tehisintellekti võidujooksu teisele tasemele VASA 1, raamistik visuaalsete afektiivsete oskustega (VAS) virtuaalsete tegelaste elutruude rääkivate nägude loomiseks, kõik portree põhjal.

Loe ka: Videomängutööstus kiirustab AI üle liituma

Portreedest rääkivate nägudeni

Kuigi see pole veel avalikkusele kättesaadav, teeb tööriist ühe portreefoto ja kõneheli ning loob hüperrealistliku kõneleva näo video, millel on täpne huulte ja heli sünkroonimine, elutruu näo käitumine ja reaalajas genereeritud loomulikud pealiigutused.

Tööriist on Microsofti uurimisrühmaga endiselt uurimistöö eelvaate etapis ja demovideod näevad muljetavaldavad.

Kuigi sellistel ettevõtetel nagu Nvidia ja Runway on juba sarnane pea liikumise ja huulte sünkroonimise tehnoloogia, näib VASA-1 olevat "palju kvaliteetsem ja realistlikum", mis vähendab suu artefakte. Tom'i juhend.

Lisaks on see lähenemine helipõhisele animatsioonile nagu hiljutine Vlogger AI Google Researchi mudel.

Microsofti sõnul on kõik näidisnäidetes olevad pildid Dall-E loodud sünteetilised, kuid VASA-1 suudab siiski animeerida reaalset pilti.

Demo näitab, kuidas erinevad inimesed räägivad peaaegu loomulike liigutuste, näoilmete ja silmade liigutustega "muude tööriistade puhul pole suu üla- ja alaosa ümber esinevaid artefakte".

Samuti ei ole selle toimimiseks vaja näoga ettepoole suunatud portree stiilis pilti.

VASA-1 pani inimesed rääkima

Tundub, et tehisintellekti entusiastid on X-platvormil tehnoloogiast, mis kirjeldab seda "metsikuna" ja "hulluna".

"Iga väljalaske vahel tehtavad täiustused on uskumatud," ütles Linus Ekenstam.

Teised on seisukohal, et maailm on tunnistajaks "seismilisele nihkele meediasisu loomise viisis" ja selle tarbimises.

"See on hämmastav, realism on tipptasemel," ütles teine ​​entusiast, keda nimetatakse Samiks.

Kuigi teised tunnistavad tööriista võimeid, arvavad nad ka, et Microsofti poolt on pisut vastutustundetu võtta kasutusele tööriist, millega saab hõlpsasti manipuleerida. valimiste süvavõltsingud.

"Metsik on sellest loobuda vahetult enne valimisi," kirjutas Rowan Cheung X platvormil.

Teine kasutaja Evan Kirstel kommenteeris karmi hoiatusega: "Microsoft Researchi VASA-1 on mängu muutja, mis loob hüperrealistlikke AI-ga loodud videoid ainult fotost ja helist."

“Võimalusi on lõputult, alates klassikaliste kinolegendide taaselustamisest kuni personaliseeritud meediani. Kuid olgem valvsad võltsitud riskide suhtes.

Juba praegu on maailm näinud valimiste süvavõltsingute sissevoolu, kus poliitikute hääli või pilte on manipuleeritud propaganda levitamiseks tehisintellekti abil. Umbes kolmandik maailma elanikkonnast läheb sel aastal valima.

Microsofti teadlased on aga märkinud, et see on vaid tutvustamiseks ja praegu ei ole kavas seda avalikult avaldada ega arendajatele kättesaadavaks teha.

Kuidas VASA-1 töötab?

Tom's Guide'i andmetel on teadlased ise üllatunud mudeli võimest "täiuslikult lauluga huultega sünkroonida, peegeldades laulja sõnu probleemideta, hoolimata sellest, et koolituse andmekogus muusikat ei kasutatud".

Lisaks käsitles VASA-1 erinevaid pildistiile, sealhulgas ajaloolisi portreesid nagu kuulsad Mona Lisa.

Tööriista saab kasutada mängude jaoks selle täiustatud huulte sünkroonimise võimete taga. Eksperdid on öelnud, et see võib keelekümbluse jaoks mängu muuta.

Lisaks võib see tehnoloogia olla kasulik sotsiaalmeedia videote avataride loomisel, nagu näiteks selliste ettevõtete puhul nagu Synthesia ja HeyGen.

Tehisintellektil põhinevad filmid ja muusikavideod võivad samuti kasutada VASA-1 tehnoloogiat realistlikumate videote jaoks.

On tõenäoline, et kui Microsoftil on osalus OpenAI-s, võib VASA-1 olla osa tulevasest kopiloodist Sora integratsioon."

spot_img

Uusim intelligentsus

spot_img

Jututuba koos meiega

Tere! Kuidas ma teid aidata saan?