4

Alibaba выпустила бесплатный генератор дипфейков по фотографии и аудиодорожке

Alibaba выпустила бесплатный генератор дипфейков по фотографии и аудиодорожке

В ИИ‑сервис Wan добавлена функция анимации изображений с синхронизацией аудиозаписи и движений губ. Модель способна создавать не только «говорящие головы», но и «оживлять» персонажа в полный рост и обстановку вокруг, как заявляют разработчики.

Как пользоваться

  • Для использования необходимо выбрать режим Avatar, прикрепить фотографию и загрузить аудиозапись длиной до 15 секунд.

  • В сервисе также присутствует генератор речи, поддерживающий только английский язык.

Ограничения и тарифы

  • Бесплатно можно генерировать неограниченное количество видео длиной до десяти секунд с разрешением 720 p в режиме «медленной» очереди.

  • Для ускорения генерации требуется получить кредиты.

  • За каждую авторизацию по кнопке Check‑in предоставляется пятьдесят бесплатных кредитов, чего достаточно для пяти видео по пять секунд.

  • Кредиты можно приобрести: минимум 150 штук за $5 (примерно 402 рубля по курсу ЦБ на 27 августа 2025 года).

Открытый исходный код

  • Alibaba разместила в открытый доступ модель Wan2.2‑S2V на 14 млрд параметров, на базе которой работает функция.

  • Веса модели доступны на HuggingFace, а код — на Github.

Больше материалов на канале РобоТок: https://t.me/tobotsp