Generatiivinen tiedustelu

Microsoftin Image to Video Tool -työkalun hämmästyttämät käyttäjät – VASA-

Treffi:

Kun kilpailu tekoälyn ylivallasta jatkuu, Microsoft haluaa nyt muuttaa ihmisten muotokuvat puhuviksi kasvoiksi tai videoiksi uusimmalla työkalullaan, VASA-1:llä.

Teknologian jättiläisen tutkimuspaperin mukaan Microsoft vie tekoälykilpailun uudelle tasolle VASA 1, puitteet visuaalisten affektiivisten taitojen (VAS) omaavien virtuaalisten hahmojen todentuntuisten puhuvien kasvojen luomiseen, kaikki muotokuvasta.

Lue myös: Videopeliteollisuus kiirehti unioniin tekoälyn yli

Muotokuvista puhuviin kasvoihin

Vaikka työkalu ei ole vielä yleisön saatavilla, se ottaa yhden muotokuvan ja puheäänen ja tuottaa hyperrealistisen puhuvan kasvovideon, jossa on tarkka huulten äänen synkronointi, todenmukainen kasvojen käyttäytyminen ja reaaliajassa luodut naturalistiset pään liikkeet.

Työkalu on edelleen tutkimuksen esikatseluvaiheessa Microsoft Research -tiimin kanssa, ja esittelyvideot "näyttävät vaikuttavilta".

Vaikka Nvidian ja Runwayn kaltaisilla yrityksillä on jo samanlainen pään liike- ja huultynkronointitekniikka, VASA-1 näyttää olevan "paljon laadukkaampi ja realistisempi", mikä vähentää suun artefakteja. Tomin opas.

Lisäksi tämä lähestymistapa ääniohjautuvaan animaatioon on kuin viimeaikainen Vlogger AI Google Researchin malli.

Microsoftin mukaan vaikka kaikki esittelyesimerkkien kuvat ovat Dall-E:n luomia synteettisiä kuvia, VASA-1 voi silti animoida todellisen kuvan.

Demossa eri ihmiset puhuvat lähes luonnollisilla liikkeillä, ilmeillä, silmien liikkeillä "ei artefakteja suun ylä- ja alaosassa, joita ei nähdä muissa työkaluissa".

Se ei myöskään vaadi kasvot eteenpäin suunnattua muotokuvatyylistä kuvaa toimiakseen.

VASA-1 sai ihmiset puhumaan

Tekoälyharrastajat näyttävät jo nyt hämmästyneen teknologiasta, joka kuvailee sitä "villiksi" ja "hulluksi" X-alustalla.

"Jokaisen julkaisun välillä saamamme parannukset ovat uskomattomia" sanoi Linus Ekenstam.

Toiset ovat sitä mieltä, että maailma on todistamassa "seismistä muutosta tavassa, jolla mediasisältöä luodaan" ja miten sitä kulutetaan.

"Tämä on hämmästyttävää, realismi on huippuluokkaa", sanoi toinen Samiksi tunnistettu harrastaja.

Vaikka toiset tunnustavat työkalun kyvyt, he myös pitävät Microsoftilta hieman vastuutonta ottaa käyttöön työkalu, jota voidaan helposti manipuloida vaalien syvät väärennökset.

"On villiä luopua tästä juuri ennen vaaleja" kirjoitti Rowan Cheung X-alustalla.

Toinen käyttäjä Evan Kirstel kommentoi ankaralla varoituksella: "Microsoft Researchin VASA-1 on pelin muuttaja, joka luo hyperrealistisia tekoälyn luomia videoita vain valokuvasta ja äänestä."

”Mahdollisuudet ovat loputtomat klassisten elokuvalegendojen elvyttämisestä yksilölliseen mediaan. Mutta pysykäämme valppaana vakavien väärennösten riskeistä."

Maailma on jo nähnyt tulvan vaaliväärennöksiä, joissa poliitikkojen ääniä tai kuvia on manipuloitu tekoälyllä propagandan levittämiseen. Noin kolmannes maailman väestöstä on tänä vuonna äänestämässä.

Microsoftin tutkijat ovat kuitenkin ilmoittaneet, että tämä on vain esittelyä, eikä tällä hetkellä ole suunnitteilla julkista julkaisua tai sen saattamista kehittäjien saataville.

Miten VASA-1 toimii?

Tom's Guiden mukaan tutkijat itse ovat yllättyneitä mallin kyvystä "synkronoida täydellisesti lauluun, heijastaen laulajan sanat ongelmitta, vaikka harjoitusaineistossa ei käytetty musiikkia".

Lisäksi VASA-1 käsitteli erilaisia ​​kuvatyylejä, mukaan lukien historialliset muotokuvat, kuten kuuluisat Mona Lisa.

Työkalua voitaisiin käyttää pelaamisessa edistyneiden huulisynkronointikykyjensä ansiosta. Asiantuntijat ovat sanoneet, että tämä voi muuttaa pelin upottamista varten.

Lisäksi tekniikka voi olla tärkeä tekijä luotaessa avatareja sosiaalisen median videoihin, kuten Synthesia ja HeyGenin kaltaisten yritysten tapauksessa.

Tekoälypohjaiset elokuvat ja musiikkivideotuotannot voivat myös hyödyntää VASA-1-tekniikkaa realistisempien videoiden luomiseen.

On todennäköistä, että kun Microsoftilla on osuus OpenAI:sta, VASA-1 voisi olla osa "tulevaisuuden kopilottia" sora liittäminen."

spot_img

Uusin älykkyys

spot_img

Keskustele kanssamme

Hei siellä! Kuinka voin olla avuksi?