Как создавать видео/фотографии в нейросети. SORA
Ниже большой разбор, как это работает на практике: что писать, куда нажимать и почему иногда получается очень красиво, а иногда странно. Будет и про видео, и про изображения, и про то, как улучшать результат.
Что такое SORA и как она делает видео из текста
Если объяснять просто, вы пишете описание сцены, а нейросеть создаёт ролик из множества кадров. Она старается, чтобы персонажи, фон, свет и движение выглядели логично и не «ломались» по ходу видео.
Видео - это не одна картинка, а серия кадров. Поэтому SORA каждый раз пересобирает сцену так, чтобы всё выглядело как одно целое.
Где всё начинается и что вы увидите
Вы заходите в интерфейс SORA. Там всегда есть:
поле, куда вы пишете текст,
кнопка генерации,
и блок с настройками.
Основные способы создания
Способ первый. Только текст.
Вы просто описываете сцену словами.
Способ второй. Картинка плюс видео.
Вы загружаете изображение и просите нейросеть его «оживить». Например, добавить движение камеры, ветер, мимику.
Способ третий. Редактирование готового результата.
Вы можете продлить видео, немного изменить сцену или переписать детали, не создавая всё с нуля.
Самое важное - как вы пишете запрос
Главная ошибка - писать слишком общее описание.
Например:
Красивая девушка идёт по городу.
Нейросеть сделает что-то, но результат будет случайным.
Хороший запрос всегда отвечает на вопросы:
что происходит,
кто в кадре,
где это происходит,
какой свет,
как движется камера,
какое настроение.
Пример нормального запроса:
Ночная улица после дождя. Парень в тёмной куртке идёт вдоль витрин, отражения неона в лужах. Камера на уровне груди, плавное движение сбоку. Мягкий свет, спокойная атмосфера.
Чем точнее описание, тем лучше результат.
Настройки, которые реально влияют
Длительность.
Чем длиннее видео, тем сложнее нейросети удерживать стабильность. Лучше начинать с коротких роликов.
Формат.
9 на 16 - для сторис и рилс.
16 на 9 - для YouTube и обычных видео.
1 на 1 - квадрат.
Качество.
Если есть выбор, берите максимальное. Картинка будет чище.
Как делать изображения через SORA
Первый способ.
Сделать короткое видео и сохранить лучший кадр.
Второй способ.
Загрузить картинку и слегка её анимировать.
Иногда видео выглядит даже лучше, чем обычная сгенерированная картинка, потому что свет и объём получаются более живыми.
Слова, которые делают картинку «дороже»
Для камеры:
медленный наезд,
плавное движение,
ручная камера.
Для света:
мягкий свет,
контровой свет,
отражения,
неон.
Для картинки:
реалистично,
кинематографично,
небольшое размытие фона,
плёночный эффект.
Эти слова помогают нейросети понять стиль, даже если вы не разбираетесь в съёмке.
Если результат странный
Если персонаж меняется или «плывёт»:
делайте видео короче,
описывайте героя подробнее,
используйте опорную картинку.
Если всё выглядит слишком мультяшно:
пишите, что нужен реализм,
добавляйте слова про естественный свет и текстуры.
Если нейросеть игнорирует важную деталь:
переносите её в начало запроса,
убирайте лишние слова.
Удобный шаблон запроса
Вы можете пользоваться таким шаблоном:
Сцена:
Герой:
Действие:
Фон:
Свет:
Камера:
Стиль:
Настроение:
Вот что получилось после данного запроса
Видео которое получилось
Ниже тот же самый текст, но более простым языком и с обращением на «вы», без акцентов и сложных формулировок.
Простые примеры
Для сторис:
Вертикальное видео. Утро, тёплый свет. Девушка идёт по улице с кофе. Камера плавно следует за ней. Реалистично, спокойная атмосфера.
Для рекламы:
Крупный план бутылки напитка на мокром камне. Капли воды, холодный пар. Камера медленно приближается. Чистый свет, фотореализм.
Для атмосферы:
Книжный магазин вечером. Тёплые лампы, дождь за окном. Камера медленно проходит между полками. Уютное настроение.
Если говорить совсем честно, SORA - это не про технологии, а про умение формулировать мысли. Чем лучше вы описываете сцену, тем красивее будет результат. По сути вы становитесь режиссёром, просто вместо камеры у вас текст.
Спасибо большое за внимание. Если вам понравится дайте знать. Приятного дня




Искусственный интеллект
5.3K поста11.7K подписчик
Правила сообщества
ВНИМАНИЕ! В сообществе запрещена публикация генеративного контента без детального описания промтов и процесса получения публикуемого результата.
Разрешено:
- Делиться вопросами, мыслями, гипотезами, юмором на эту тему.
- Делиться статьями, понятными большинству аудитории Пикабу.
- Делиться опытом создания моделей машинного обучения.
- Рассказывать, как работает та или иная фиговина в анализе данных.
- Век жить, век учиться.
Запрещено:
I) Невостребованный контент
I.1) Создавать контент, сложный для понимания. Такие посты уйдут в минуса лишь потому, что большинству неинтересно пробрасывать градиенты в каждом тензоре реккурентной сетки с AdaGrad оптимизатором.
I.2) Создавать контент на "олбанском языке" / нарочно игнорируя правила РЯ даже в шутку. Это ведет к нечитаемости контента.
I.3) Добавлять посты, которые содержат лишь генеративный контент или нейросетевой Арт без какой-то дополнительной полезной или интересной информации по теме, без промтов или описания методик создания и т.д.
II) Нетематический контент
II.1) Создавать контент, несвязанный с Data Science, математикой, программированием.
II.2) Создавать контент, входящий в противоречие существующей базе теорем математики. Например, "Земля плоская" или "Любое действительное число представимо в виде дроби двух целых".
II.3) Создавать контент, входящий в противоречие с правилами Пикабу.
III) Непотребный контент
III.1) Эротика, порнография (даже с NSFW).
III.2) Жесть.
За нарушение I - предупреждение
За нарушение II - предупреждение и перемещение поста в общую ленту
За нарушение III - бан