Генеративный анализ данных

Пользователи поражены инструментом Microsoft Image to Video – VASA-

Дата:

Поскольку гонка за превосходство ИИ продолжается, Microsoft теперь хочет преобразовать портретные изображения людей в говорящие лица или видео с помощью своего новейшего инструмента VASA-1.

Согласно исследованию технологического гиганта, Microsoft выводит гонку искусственного интеллекта на новый уровень. ВАСА 1, основа для создания реалистичных говорящих лиц виртуальных персонажей с визуально-аффективными навыками (ВАС), все из портрета.

Читайте также: Индустрия видеоигр спешит объединиться в профсоюзы из-за искусственного интеллекта

От портретов к говорящим лицам

Хотя он еще не доступен для широкой публики, инструмент делает одну портретную фотографию и звук речи и создает гиперреалистичное видео говорящего лица с точной синхронизацией звука губ, реалистичным поведением лица и натуралистичными движениями головы, генерируемыми в реальном времени.

Инструмент все еще находится на стадии предварительного исследования исследовательской командой Microsoft, и демонстрационные видеоролики «выглядят впечатляюще».

В то время как такие компании, как Nvidia и Runway, уже имеют аналогичную технологию движения головы и синхронизации губ, VASA-1, похоже, «имеет гораздо более высокое качество и реалистичность», что уменьшает артефакты рта, по словам Руководство пользователя Tom's Guide.

Кроме того, этот подход к анимации, управляемой звуком, также похож на недавний подход. Видеоблогер ИИ Модель от Google Research.

По заявлению Microsoft, хотя все изображения в демонстрационных примерах являются синтетическими, созданными Dall-E, VASA-1 все же может анимировать реальную картинку.

Демонстрация показывает, как разные люди разговаривают с почти естественными движениями, выражениями лица, движениями глаз: «никаких артефактов вокруг верхней и нижней части рта, наблюдаемых в других инструментах».

Для работы также не требуется портретное изображение лицом вперед.

ВАСА-1 заставил людей говорить

Энтузиасты искусственного интеллекта, кажется, уже поражены технологией, описывающей ее как «дикую» и «безумную» на платформе X.

«Улучшения, которые мы получаем между каждым выпуском, невероятны» — сказал Линус Экенстам.

Другие считают, что мир является свидетелем «сейсмического сдвига в способах создания медиаконтента» и его потребления.

«Это потрясающе, реализм на высшем уровне», — сказал другой энтузиаст по имени Сэм.

Хотя другие признают возможности этого инструмента, они также считают, что со стороны Microsoft несколько безответственно представлять инструмент, которым можно легко манипулировать в целях безопасности. предвыборные дипфейки.

«Дико отказаться от этого прямо перед выборами», писал Роуэн Чунг на платформе X.

Другой пользователь Эван Кирстел прокомментировал со строгим предупреждением: «Система VASA-1 от Microsoft Research меняет правила игры, создавая гиперреалистичные видеоролики, созданные искусственным интеллектом, из фотографий и аудио».

«Возможности безграничны: от возрождения классических легенд кино до персонализированных медиа. Но давайте будем внимательны к рискам дипфейков».

Мир уже стал свидетелем наплыва дипфейков выборов, в которых голоса или изображения политиков манипулировались с помощью ИИ для распространения пропаганды. В этом году на выборы придет около трети населения мира.

Однако исследователи из Microsoft указали, что это всего лишь демонстрация, и в настоящее время нет планов по публичному выпуску или предоставлению доступа разработчикам.

Как работает ВАСА-1?

По данным Tom's Guide, сами исследователи удивлены способностью модели «идеально синхронизировать губы с песней, без проблем отражая слова певца, несмотря на то, что в наборе обучающих данных не используется музыка».

Кроме того, VASA-1 обрабатывал различные стили изображений, включая исторические портреты, такие как знаменитый Мона Лиза.

Этот инструмент можно использовать в играх благодаря его расширенным возможностям синхронизации губ. По мнению экспертов, это может изменить правила игры в сфере погружения.

Кроме того, эта технология может сыграть важную роль в создании аватаров для видеороликов в социальных сетях, как в случае с такими фирмами, как Synthesia и HeyGen.

В фильмах и музыкальных клипах на основе искусственного интеллекта также можно использовать технологию VASA-1 для создания более реалистичных видеороликов.

Есть вероятность, что, поскольку Microsoft имеет долю в OpenAI, VASA-1 может стать частью «будущего второго пилота». Сора интеграция ».

Spot_img

Последняя разведка

Spot_img

Чат с нами

Всем привет! Могу я чем-нибудь помочь?