Alibaba выпустила бесплатный генератор дипфейков по фотографии и аудиодорожке
В ИИ‑сервис Wan добавлена функция анимации изображений с синхронизацией аудиозаписи и движений губ. Модель способна создавать не только «говорящие головы», но и «оживлять» персонажа в полный рост и обстановку вокруг, как заявляют разработчики.
Как пользоваться
Для использования необходимо выбрать режим Avatar, прикрепить фотографию и загрузить аудиозапись длиной до 15 секунд.
В сервисе также присутствует генератор речи, поддерживающий только английский язык.
Ограничения и тарифы
Бесплатно можно генерировать неограниченное количество видео длиной до десяти секунд с разрешением 720 p в режиме «медленной» очереди.
Для ускорения генерации требуется получить кредиты.
За каждую авторизацию по кнопке Check‑in предоставляется пятьдесят бесплатных кредитов, чего достаточно для пяти видео по пять секунд.
Кредиты можно приобрести: минимум 150 штук за $5 (примерно 402 рубля по курсу ЦБ на 27 августа 2025 года).
Открытый исходный код
Alibaba разместила в открытый доступ модель Wan2.2‑S2V на 14 млрд параметров, на базе которой работает функция.
Веса модели доступны на HuggingFace, а код — на Github.
Больше материалов на канале РобоТок: https://t.me/tobotsp
