Generativna podatkovna inteligenca

Uporabniki, ki jih je Microsoftovo orodje za sliko v video – VASA-

Datum:

Ker se tekma za premoč AI nadaljuje, želi Microsoft s svojim najnovejšim orodjem VASA-1 spremeniti portretne slike ljudi v govoreče obraze ali videoposnetke.

Glede na raziskavo tehnološkega velikana Microsoft dviguje dirko z umetno inteligenco na drugo raven, s VASA 1, okvir za ustvarjanje realističnih govorečih obrazov virtualnih likov z vizualnimi afektivnimi veščinami (VAS), vse iz portreta.

Preberite tudi: Industrija videoiger hiti z združevanjem v zvezi z umetno inteligenco

Od portretov do govorečih obrazov

Čeprav še ni na voljo javnosti, orodje posname eno samo portretno fotografijo in zvok govora ter ustvari hiperrealističen videoposnetek govorečega obraza z natančno sinhronizacijo zvoka ustnic, realističnim vedenjem obraza in naravoslovnimi gibi glave, ustvarjenimi v realnem času.

Orodje je še vedno v fazi predogleda raziskave z Microsoftovo raziskovalno ekipo in predstavitveni videoposnetki "izgledajo impresivno."

Medtem ko podjetja, kot sta Nvidia in Runway, že imajo podobno tehnologijo premikanja glave in sinhronizacije ustnic, se zdi, da je VASA-1 "veliko višje kakovosti in realizma", kar zmanjšuje artefakte v ustih, glede na Tomov vodnik.

Poleg tega je ta pristop k animaciji na podlagi zvoka podoben nedavnemu Vlogger AI model Google Research.

Po mnenju Microsofta lahko VASA-1 kljub temu, da so vse slike v demonstracijskih primerih sintetične, ki jih je ustvaril Dall-E, še vedno animira pravo sliko.

Demo prikazuje različne ljudi, ki se pogovarjajo s skoraj naravnimi gibi, izrazi obraza, gibi oči "brez artefaktov okoli zgornjega in spodnjega dela ust, ki jih vidimo pri drugih orodjih."

Prav tako ne potrebuje podobe v pokončnem slogu z licem naprej, da bi deloval.

VASA-1 je spodbudil ljudi k pogovoru

Zdi se, da so navdušenci nad AI že navdušeni nad tehnologijo, ki jo na platformi X opisujejo kot "divjo" in "noro".

"Izboljšave, ki jih dobimo med vsako izdajo, so neverjetne," je dejal Linus Ekenstam.

Drugi so mnenja, da je svet priča "seizmičnemu premiku v načinu ustvarjanja medijske vsebine" in v tem, kako se porabi.

"To je osupljivo, realizem je vrhunski," je dejal drug navdušenec, identificiran kot Sam.

Čeprav drugi priznavajo zmožnosti orodja, menijo tudi, da je nekoliko neodgovorno s strani Microsofta, da uvede orodje, s katerim je mogoče zlahka manipulirati za volilni deepfakes.

"Bil bi to opustil tik pred volitvami," Napisal Rowan Cheung na platformi X.

Drug uporabnik Evan Kirstel komentiral s strogim opozorilom: "Vasa-1 podjetja Microsoft Research spreminja igre, saj ustvarja hiperrealistične videoposnetke, ustvarjene z umetno inteligenco, samo iz fotografije in zvoka."

»Možnosti je neskončno, od oživljanja klasičnih kinematografskih legend do personaliziranih medijev. Vendar bodimo pozorni na tveganja deepfake.«

Svet je že bil priča dotoku volilnih globokih ponaredkov, kjer so bili glasovi ali slike politikov manipulirani z uporabo umetne inteligence za širjenje propagande. Približno tretjina svetovnega prebivalstva se bo letos udeležila volitev.

Vendar pa so raziskovalci pri Microsoftu navedli, da je to samo za predstavitev in da trenutno ni načrtov za javno izdajo ali dajanje na voljo razvijalcem.

Kako deluje VASA-1?

Glede na Tom's Guide so raziskovalci sami presenečeni nad zmožnostjo modela, da se "popolnoma sinhronizira s pesmijo in brez težav odraža besede pevca, čeprav v naboru podatkov za usposabljanje ni bila uporabljena glasba."

Poleg tega je VASA-1 obdelal različne slikovne sloge, vključno z zgodovinskimi portreti, kot je slavni Mona Lisa.

Orodje bi se lahko uporabljalo pri igranju iger na podlagi njegovih naprednih zmožnosti sinhronizacije ustnic. Strokovnjaki pravijo, da bi to lahko spremenilo igro za potopitev.

Poleg tega je lahko tehnologija ključna pri ustvarjanju avatarjev za videoposnetke v družabnih medijih, kot v primeru podjetij, kot sta Synthesia in HeyGen.

Filmi in glasbene video produkcije, ki temeljijo na umetni inteligenci, lahko izkoristijo tudi tehnologijo VASA-1 za bolj realistične videoposnetke.

Ker ima Microsoft delež v OpenAI, obstaja verjetnost, da bo VASA-1 del »prihodnjega kopilota«. Sora integracija."

spot_img

Najnovejša inteligenca

spot_img

Klepetajte z nami

Zdravo! Kako vam lahko pomagam?