Google официально выпустила Veo 3.1 – обновлённую версию своей нейросети для генерации видео – 15 октября 2025 года . Эта модель предназначена для преобразования текстовых (и графических) описаний в короткие видеоролики. В отличие от предшественника (Veo 3.0, представленной на Google I/O в мае 2025 года ), новая версия получила ряд существенных улучшений. Ниже рассмотрим официально заявленные изменения, новые функции и возможности Veo 3.1, сравним её с версией 3.0, а также приведём отзывы и наблюдения первых пользователей и экспертов.
Официальные изменения и улучшения в Veo 3.1
Google отмечает несколько ключевых улучшений в Veo 3.1 по сравнению с предыдущей версией Veo 3.0. Главные из них:
Реалистичность видео и графики. Улучшены реализм и детализация генерируемых клипов – модель точнее воспроизводит текстуры и физику реального мира . Видеоролики стали выглядеть «более живыми» за счёт правдоподобных деталей окружающей среды . По словам компании, Veo 3.1 обеспечивает качество видео на уровне передовых технологий генерации .
Качество и “понимание” запросов. Новая версия лучше следует текстовым запросам пользователя и точнее интерпретирует сложные подсказки . Улучшено понимание повествовательных сценариев, кинематографических стилей и взаимодействия персонажей, что даёт создателям больше контроля над сюжетом и стилем видео . Проще говоря, модель стремится ближе соответствовать описанной пользователем задумке.
Нативная генерация звука (Audio). Главное нововведение – поддержка звукового сопровождения во всех режимах. Veo 3.1 умеет генерировать богатый аудиоряд: накладывать звуковые эффекты, музыку, фоновые шумы и даже синтезированную речь персонажей прямо вместе с видео . По официальным заявлениям, качество звука стало более высоким, а ролики со звуком – более реалистичными и выразительными . Пример: теперь можно сгенерировать сцену диалога двух персонажей – модель озвучит их реплики нужными голосами и синхронизирует речь с движением губ .
Улучшение функции Image-to-Video. При использовании графических референсов (изображений) для генерации видео, Veo 3.1 теперь выдаёт более качественный аудио-визуальный результат и лучше сохраняет стили/особенности исходных изображений . Например, если загрузить фото персонажа или образец стиля, нейросеть точнее перенесёт их во внешний вид и движения героев видео.
Поддержка разных форматов и ракурсов. Veo 3.1 позволяет генерировать видео как в горизонтальном формате 16:9, так и в вертикальном 9:16 (поддержка вертикального видео заявлена официально) . Это удобно для создания контента под разные платформы (например, широкоформатное видео для YouTube или вертикальное для сторис). Также улучшена работа с различными стилями съёмки и движениями камеры для кинематографичности (хотя ряд таких возможностей пока в тестовом режиме) .
Максимальная длительность и разрешение. Официально длина генерируемого ролика осталась ограничена 8 секундами (как и в Veo 3.0) при разрешении до 720p . Функциональность более длинных видео (30 секунд и больше) пока в прямой генерации не доступна, несмотря на ходившие слухи . Тем не менее, благодаря новой функции «Extend» (см. ниже) пользователь может последовательно расширять видео, соединяя несколько сегментов по 8 с и тем самым получить сцены длительностью до минуты и более . В будущем Google может увеличить это ограничение по мере совершенствования модели.
Новые функции и возможности Veo 3.1
Veo 3.1 не только улучшает качество генерируемого видео и звука, но и добавляет ряд новых функций для творчества – особенно в связке с инструментом Google Flow (AI-видеоредактором). Ниже перечислены основные новые возможности:
Ingredients to Video (референсы-«ингредиенты»). Теперь можно задать несколько референсных изображений (до трёх) – например, изображение героя, фоновой обстановки, стиля одежды – и сгенерировать видео, объединив эти элементы в одну сцену . Эта функция существовала и в Veo 3.0, но в Veo 3.1 она поддерживает генерацию звука. Модель старается учесть все указанные «ингредиенты» и добавить соответствующее музыкальное или звуковое сопровождение к полученному клипу . Это даёт больше контроля над составом сцены и стилем финального ролика.
Frames to Video (кадры в видео). Пользователь может задать стартовый и финальный кадр (два изображения), а Veo 3.1 создаст плавный видеоролик, соединяющий начало и конец . Такой переходной ролик органично связывает два статичных кадра, что полезно для творческих переходов или имитации таймлапса. Новшество версии 3.1 – помимо визуального перехода, добавляется аудио: звук также будет эволюционировать от первого кадра к последнему, делая сцену более цельной .
Extend (продление видео). Функция, позволяющая расширять существующее видео, генерируя продолжение сцены. Достаточно взять последние ~1 секунду исходного клипа, и Veo 3.1 создаст следующий 8-секундный фрагмент, логически продолжающий действие . Повторяя этот шаг, можно последовательно получить ролик длительностью до 1 минуты или более – при этом все части будут связаны по содержанию и стилю. В версии 3.1 генерация продления сопровождается нативным звуком, что делает длинные сцены бесшовными и реалистичными (фоновые шумы и музыка будут непрерывными) .
Insert (вставка объектов). Новая экспериментальная возможность для точного редактирования: пользователь может добавить в уже сгенерированное видео новый элемент или персонажа, описав его текстом . Например, можно «дорисовать» в сцене реалистичный объект или даже фантастическое существо. Veo 3.1 автоматически обработает сложные детали (корректно наложит тени, учтёт освещение сцены и т.д.), чтобы вставка выглядела естественно . Эта функция реализована на базе возможностей Flow и поддерживается только в Veo 3.1.
Remove (удаление объектов). Обратная по смыслу функция (находится в стадии запуска): позволит удалять нежелательные объекты или персонажей из сгенерированного видео . После удаления лишнего элемента модель заполняет «дыру» на фоне, восстановив задний план так, словно удалённого объекта там никогда не было. По отзывам, на момент релиза Veo 3.1 эта функция ещё не была активна во Flow (Google обещает добавить её вскоре) .
Мульти-языковая озвучка. Veo 3.1 способна синтезировать речь персонажей на разных языках. Google особенно отмечает улучшенную работу со звуком и озвучкой, включая поддержку русского голоса . Хотя понимать промпты на русском модель пока не научилась, если вставить русскую реплику в англоязычное описание сцены, Veo 3.1 озвучит её правильным русским произношением и интонациями . Это заметное улучшение по сравнению с ранними версиями, где даже при наличии аудио такие нюансы отсутствовали.
Все вышеперечисленные функции работают в рамках Google Flow – интерактивного видеоредактора, где встроена Veo 3.1. Некоторые возможности (например, Insert и Extend) требуют активной подписки и являются экспериментальными, но именно они дают пользователям более тонкий контроль над результатом. В совокупности, по словам Google, Veo 3.1 предоставляет беспрецедентный ранее уровень настроек и творчества для генеративного видео .
Сравнение Veo 3.1 и Veo 3.0
Veo 3.0 (известная просто как Veo 3) была представлена в мае 2025 и сама по себе стала большим шагом вперёд, введя озвучивание в генеративное видео . Однако Veo 3.1 развивается дальше, устраняя ограничения и добавляя улучшения. Ключевые отличия новой версии от предыдущей:
Звук: Veo 3.0 уже умела генерировать аудио (это была первая модель с нативной озвучкой видео ), но в версии 3.1 звуковое сопровождение стало качественнее и везде по умолчанию. Теперь любой сгенерированный ролик имеет саундтрек: будь то эффекты окружения, музыка или речь. Ранее звук в некоторых режимах мог отсутствовать или требовал отдельного шага; теперь же аудиогенерация интегрирована во все функции (референсы, продление, кадры и пр.) . Например, если Veo 3.0 могла сгенерировать немой клип по двум кадрам, то Veo 3.1 сразу добавит к нему подходящий звук .
Качество видео: По сравнению с 3.0 заметно улучшена чёткость и фотореализм изображения. Veo 3.1 лучше воспроизводит мелкие детали, текстуры и освещение, благодаря чему сцены выглядят ещё правдоподобнее . Пользователи отмечают, что природа, свет и тени в роликах стали более реалистичными, а текстуры – менее «размытыми» . Также заявляется повышение точности физического моделирования (например, движение жидкостей, динамика объектов) по сравнению с Veo 3.0 .
Следование промптам: Veo 3.1 строже следует описанию. Если прошлой версии иногда требовалась доработка промпта, чтобы добиться нужной сцены, то новая версия чаще с первого раза попадает в задуманный сюжет . Google подчёркивает усиленную приверженность запросу: улучшены алгоритмы соответствия текста и видео, чтобы результат ближе соответствовал введённому сценарию .
Стили и кинематографичность: В Veo 3.0 появился набор базовых стилей и возможность задавать движение камеры, однако Veo 3.1 делает шаг вперёд в понимании режиссуры. У неё более глубокое понимание кинематографических стилей и повествования . Это проявляется в том, что модель может выдерживать определённый художественный стиль на протяжении всего ролика, правильно размещать персонажей в кадре, а также генерировать последовательные диалоги и взаимодействия между героями. Проще говоря, Veo 3.1 лучше «мыслит как режиссёр», тогда как Veo 3.0 больше фокусировалась на отдельных кадрах.
Новые инструменты редактирования: Многие функции редактирования (референс-изображения, задание первых/последних кадров, продление видео) были впервые представлены именно в Veo 3.0. Однако в версии 3.1 они существенно расширены. К примеру, поддержка нескольких референсов: если Veo 3.0 позволяла задать 1–2 изображения в подсказке, то Veo 3.1 официально поддерживает сразу несколько и комбинирует их в сцене . Также абсолютно новые функции вроде Insert и Remove отсутствовали в Veo 3.0 – их добавили только в 3.1. Таким образом, Veo 3.1 предоставляет более мощный инструментарий для пост-генеративной правки видео, чего раньше не было.
Производительность и режимы: В Veo 3.1 появились два режима генерации: Quality (максимальное качество, дольше) и Fast (ускоренная генерация, возможно с упрощением) . Veo 3.0 тоже был ограничен ~8 секундами, но не имел явно выделенной «быстрой» конфигурации – режим Fast (Veo 3.1 Fast) введён сейчас, чтобы ускорить вывод за счёт некоторого снижения детализации . Кроме того, судя по отзывам, Veo 3.1 может использовать больше памяти или улучшенные вычислительные ресурсы, что отражается на лучших текстурах и стабильности работы модели .
В сумме Veo 3.1 можно рассматривать как эволюционное обновление: оно не переворачивает возможности с ног на голову, но устраняет недостатки предшественника и повышает планку качества. Эксперты отмечают, что если Veo 3.0 уже возглавляла рейтинги генеративного видео (разделяя 1-е место с конкурентом Sora 2 Pro от OpenAI), то улучшения версии 3.1 могут вывести Google в явные лидеры этой гонки . В частности, интеграция аудио и улучшенная стабильность, вероятно, отрыв увеличат .
Неформальные отзывы пользователей и экспертов
Первыми доступ к Veo 3.1 получили участники бета-тестирования Google Flow, и хотя официальный анонс последовал лишь 15 октября, сообщество активно делилось впечатлениями. Вот несколько наблюдений и мнений с форумов и соцсетей:
Качество видео. Многие отмечают, что детализация улучшилась, но не радикально: «качество улучшилось тонко (subtly)» – пишет один из комментаторов, сравнив ролики Veo 3.1 с предыдущими . Другая деталь – улучшенная проработка текстур. Предполагают, что модели выделено больше памяти для генерации, поэтому сложные поверхности выглядят лучше . В целом видео стало более кинематографичным, особенно сцены с природой и освещением выглядят реалистичнее .
Ограничение длительности. Пользователи подтверждают, что базовый лимит всё так же составляет 8 секунд на один сгенерированный фрагмент . Один из бета-тестеров сначала подумал, что длительность 6 сек, но его поправили – Veo 3 всегда генерирует до ~8 секунд . При этом функция Extend действительно позволяет связать сегменты, получив дольше видео (некоторые уже экспериментировали с почти минутными сценами). Но прямой генерации длинных роликов пока нет, и, по слухам, это ограничение связано с архитектурой модели (для стабильной работы выбрана именно ~8 секундная последовательность) .
Неполадки и стабильность. Ряд пользователей заметили, что скорость генерации в новом Veo очень высокая – зачастую клип рендерится за считанные секунды. Однако иногда случаются сбои: на Flow некоторые видео доходят до 99% и «зацикливаются» или прерываются на последнем кадре, после чего кредиты возвращаются (система не списывает плату за неудачную попытку) . Такие случаи скорее исключения, но они есть. В целом же платформа работает стабильно, и многие хвалят быстродействие (особенно в режиме Fast).
Русский язык и текст. Российские пользователи отдельно протестировали локализацию: Veo 3.1 действительно лучше справляется с русскоязычными сюжетами. Если задать описание сцены на английском, но включить в диалоги русскую речь, озвучка получается на хорошем русском, с правильными ударениями . Однако генерация надписей (текста на видео) по-прежнему вызывает сложности: как и во многих AI-графиках, кириллический текст искажается – буквы «плывут», шрифты выглядят неправдоподобно, особенно в мелких надписях или вывесках . То есть читать сгенерированные плакаты или таблички пока нельзя, хотя с латиницей модель справляется чуть лучше.
Доступность функций. Некоторые энтузиасты заметили, что заявленные фичи 3.1 появляются постепенно. Например, сразу после выхода Insert был доступен, а вот Remove ещё нет . Также упоминались «движения камеры» и «контроль персонажей» – эти расширенные настройки фигурируют в документации, но в интерфейсе Flow их на старте не обнаружили . Вероятно, Google будет активировать эти возможности постепенно, дорабатывая их на стороне сервера. Тем не менее, уже сейчас функциональность очень широкая, и участники тестов называют её впечатляющей.
Конкуренты и впечатления. В среде AI-энтузиастов Veo 3.1 встретили с энтузиазмом. В соцсетях пишут, что «платформа преобразила подход к личным творческим проектам, словно воображению выдали суперспособность», и что команда разработчиков «постоянно на связи и двигает границы возможного» . Многие сравнивают Veo с конкурентами: упоминается модель Sora 2 Pro (считающаяся одним из лидеров наряду с Veo 3). Теперь же, с интеграцией аудио, некоторые прогнозируют, что Veo 3.1 превзойдёт Sora 2 по впечатлению от результатов . На форумах также обсуждают, что рейтинги LMArena – где Veo 3.0 делила первое место – могут скоро обновиться в пользу Google .
В целом отзывы подчёркивают: Veo 3.1 стало значительным шагом вперёд. Пользователи особенно довольны появлением звука – даже скептики отмечают, что ролики с озвучкой смотрятся на порядок эффектнее. Конечно, остаются и пожелания (например, все ждут увеличения длины видео и полной поддержки удаления объектов), но тенденция очевидна: качество генерируемого ИИ-видео стремительно растёт с каждой версией.
Veo 3.1 подтверждает стремительное развитие генеративных нейросетей в сфере видео. Официальные улучшения (аудио, реализм, управление) поддерживаются реальными впечатлениями пользователей: модель стала надёжнее и гибче. Осталось дождаться, какие ещё обновления принесёт будущая Veo 4, но уже сейчас ясно, что видеогенераторы от Google выходят на новый уровень в 2025 году .
Источники: Google AI Blog , TechCrunch , 3DNews , DTF , iPhones.ru , Хабр , Reddit (r/singularity) .