Пользователи поражены инструментом Microsoft Image To Video

Поскольку гонка за превосходство ИИ продолжается, Microsoft теперь хочет преобразовать портретные изображения людей в говорящие лица или видео с помощью своего новейшего инструмента VASA-1.

Согласно исследованию технологического гиганта, Microsoft выводит гонку искусственного интеллекта на новый уровень. ВАСА 1, основа для создания реалистичных говорящих лиц виртуальных персонажей с визуально-аффективными навыками (ВАС), все из портрета.

От портретов к говорящим лицам

Хотя он еще не доступен для широкой публики, инструмент делает одну портретную фотографию и звук речи и создает гиперреалистичное видео говорящего лица с точной синхронизацией звука губ, реалистичным поведением лица и натуралистичными движениями головы, генерируемыми в реальном времени.

Инструмент все еще находится на стадии предварительного исследования исследовательской командой Microsoft, и демонстрационные видеоролики «выглядят впечатляюще».

В то время как такие компании, как Nvidia и Runway, уже имеют аналогичную технологию движения головы и синхронизации губ, VASA-1, похоже, «имеет гораздо более высокое качество и реалистичность», что уменьшает артефакты рта, по словам Руководство пользователя Tom's Guide.

Кроме того, этот подход к анимации, управляемой звуком, также похож на недавний подход. Видеоблогер ИИ Модель от Google Research.

По заявлению Microsoft, хотя все изображения в демонстрационных примерах являются синтетическими, созданными Dall-E, VASA-1 все же может анимировать реальную картинку.

Демонстрация показывает, как разные люди разговаривают с почти естественными движениями, выражениями лица, движениями глаз: «никаких артефактов вокруг верхней и нижней части рта, наблюдаемых в других инструментах».

Для работы также не требуется портретное изображение лицом вперед.

Microsoft только что представила VASA-1.

Это новая модель искусственного интеллекта, которая может превратить 1 фотографию и 1 аудиозапись в полностью реалистичную человеческую дипфейк.

Дико бросить это прямо перед выборами 😬pic.twitter.com/MuLkZVOKRM

— Роуэн Чунг (@rowancheung) 18 апреля 2024

ВАСА-1 заставил людей говорить

Энтузиасты искусственного интеллекта, кажется, уже поражены технологией, описывающей ее как «дикую» и «безумную» на платформе X.

«Улучшения, которые мы получаем между каждым выпуском, невероятны» — сказал Линус Экенстам.

Другие считают, что мир является свидетелем «сейсмического сдвига в способах создания медиаконтента» и его потребления.

«Это потрясающе, реализм на высшем уровне», — сказал другой энтузиаст по имени Сэм.

Хотя другие признают возможности этого инструмента, они также считают, что со стороны Microsoft несколько безответственно представлять инструмент, которым можно легко манипулировать в целях безопасности. предвыборные дипфейки.

«Дико отказаться от этого прямо перед выборами», писал Роуэн Чунг на платформе X.

Другой пользователь Эван Кирстел прокомментировал со строгим предупреждением: «Система VASA-1 от Microsoft Research меняет правила игры, создавая гиперреалистичные видеоролики, созданные искусственным интеллектом, из фотографий и аудио».

«Возможности безграничны: от возрождения классических легенд кино до персонализированных медиа. Но давайте будем внимательны к рискам дипфейков».

Мир уже стал свидетелем наплыва дипфейков выборов, в которых голоса или изображения политиков манипулировались с помощью ИИ для распространения пропаганды. В этом году на выборы придет около трети населения мира.

Однако исследователи из Microsoft указали, что это всего лишь демонстрация, и в настоящее время нет планов по публичному выпуску или предоставлению доступа разработчикам.

Как работает ВАСА-1?

По данным Tom's Guide, сами исследователи удивлены способностью модели «идеально синхронизировать губы с песней, без проблем отражая слова певца, несмотря на то, что в наборе обучающих данных не используется музыка».

Кроме того, VASA-1 обрабатывал различные стили изображений, включая исторические портреты, такие как знаменитый Мона Лиза.

Этот инструмент можно использовать в играх благодаря его расширенным возможностям синхронизации губ. По мнению экспертов, это может изменить правила игры в сфере погружения.

Кроме того, эта технология может сыграть важную роль в создании аватаров для видеороликов в социальных сетях, как в случае с такими фирмами, как Synthesia и HeyGen.

В фильмах и музыкальных клипах на основе искусственного интеллекта также можно использовать технологию VASA-1 для создания более реалистичных видеороликов.

Есть вероятность, что, поскольку Microsoft имеет долю в OpenAI, VASA-1 может стать частью «будущего второго пилота». Сора интеграция ».

SEO-контент и PR-распределение. Получите усиление сегодня.
PlatoData.Network Вертикальный генеративный ИИ. Расширьте возможности себя. Доступ здесь.
ПлатонАйСтрим. Интеллект Web3. Расширение знаний. Доступ здесь.
ПлатонЭСГ. Углерод, чистые технологии, Энергия, Окружающая среда, Солнечная, Управление отходами. Доступ здесь.
ПлатонЗдоровье. Биотехнологии и клинические исследования. Доступ здесь.
Источник: https://metanews.com/enthusiasts-smitten-by-image-to-video-tool-vasa-1/

Генеративный анализ данных

Пользователи поражены инструментом Microsoft Image to Video – VASA-

От портретов к говорящим лицам

ВАСА-1 заставил людей говорить

Как работает ВАСА-1?

Игра Magic Force 7 в Кливленде

Удивительные впечатления от «Звездных войн», которые вы можете получить в виртуальной реальности прямо сейчас

Последняя разведка

VR-игры по «Звездным войнам» ждут большие скидки 4 мая

Замечательные технические истории на этой неделе из Интернета (до 4 мая)

PEPE готовится к большому скачку: ожидается повышение цен на 80%?

Биткойн подскочил выше 64,000 78 долларов после того, как GBTC Grayscale зафиксировал 63-дневную полосу оттока с XNUMX миллионами долларов новых денег

Споры об авторских правах Moonbirds выявляют недостатки в одержимости криптовалют IP – Расшифруйте

WienerAI достигает важной вехи, поскольку держатели спешат поставить свои WAI

Чат с нами