Проверяем Kling - не всё так волшебно
Если кто-то не в курсе, к китайскому видеогенератору Kling открыли доступ по всему миру, причем что каждый день можно бесплатно сгенерировать 6 видео.
Я подождал пока немного пройдет хайп, чтобы одно видео не генерировалось по полдня и теперь расскажу вам про него и покажу что получилось.
Чтобы вы смогли зарегистрироваться в клинге и вообще использовать его, вам нужно зайти именно по этой ссылке. Просто в поиске вы можете попасть на китайскую версию сайта, где регистрация только по номеру телефона, естественно, китайскому.
Регистрация максимально простая - просто вводите почту и пароль, ну и код, который приходит на почту. На бесплатном тарифе вам дают 66 кредитов в день - 1 видео стоит 10 кредитов.
Дальше переходите в конструктор, вводите промпт не больше, чем на 2500 символов. Также можно выбрать степень креативности-релевантности, ориентацию видео, движение камеры и добавить негативный промпт. В платной версии доступен еще профессиональный мод и можно сделать видео на 10 секунд.
Я не сильно заморачивался и написал наброски того, что хочу видеть в видео в ChatGPT, чтобы он составил мне промпт.
Первый вышел таким:
A girl with red hair, standing on a street in a futuristic cyberpunk city, smoking a cigarette. Her hair stands out brightly against the neon lights and tall buildings with technological advertisements. The atmosphere is filled with dense fog and the sounds of a futuristic city. She is wearing a leather jacket and augmented reality glasses, which reflect multicolored lights. The smoke from the cigarette slowly rises, mixing with the neon light, creating a mesmerizing effect
Результат на первом видео. Все получилось довольно неплохо, конечно же, кроме рта и пальцев.
После этого я решил проверить, как сервис справится с животным в таком же стиле, снова обратившись к ChatGPT:
A sleek-furred cat sitting on a street in a cyberpunk city. Around it, there are tall neon buildings and technological advertisements glowing with bright colors. The sky is covered with dense fog, and the sounds of a futuristic city fill the air. The cat is attentively watching people passing by and drones flying overhead. It has a glowing collar with a small holographic display. Its eyes reflect the multicolored lights of the city, creating a mysterious and captivating atmosphere.
В этот раз я добавил максимальный отдаляющийся зум, и именно поэтому, мне кажется, морда кота так сильно меняется.
Я убрал зум и котик уже выглядит намного лучше, но не обращаем внимание на размер машин и людей)
А вот избавиться от сигареты в видео с девушкой у меня не получилось, даже через негативный промпт.
Вообще, попытки сгенерировать нормальное видео напомнило мне первые шаги в генерации изображений - видишь, что у других получается круто, пробуешь сам, а у тебя какое-то мессиво выходит. Видимо, нужно очень много экспериментировать с формулировками запросов. Ждем гайды на эту тему.
Искусственный интеллект
4.5K постов11.3K подписчиков
Правила сообщества
ВНИМАНИЕ! В сообществе запрещена публикация генеративного контента без детального описания промтов и процесса получения публикуемого результата.
Разрешено:
- Делиться вопросами, мыслями, гипотезами, юмором на эту тему.
- Делиться статьями, понятными большинству аудитории Пикабу.
- Делиться опытом создания моделей машинного обучения.
- Рассказывать, как работает та или иная фиговина в анализе данных.
- Век жить, век учиться.
Запрещено:
I) Невостребованный контент
I.1) Создавать контент, сложный для понимания. Такие посты уйдут в минуса лишь потому, что большинству неинтересно пробрасывать градиенты в каждом тензоре реккурентной сетки с AdaGrad оптимизатором.
I.2) Создавать контент на "олбанском языке" / нарочно игнорируя правила РЯ даже в шутку. Это ведет к нечитаемости контента.
I.3) Добавлять посты, которые содержат лишь генеративный контент или нейросетевой Арт без какой-то дополнительной полезной или интересной информации по теме, без промтов или описания методик создания и т.д.
II) Нетематический контент
II.1) Создавать контент, несвязанный с Data Science, математикой, программированием.
II.2) Создавать контент, входящий в противоречие существующей базе теорем математики. Например, "Земля плоская" или "Любое действительное число представимо в виде дроби двух целых".
II.3) Создавать контент, входящий в противоречие с правилами Пикабу.
III) Непотребный контент
III.1) Эротика, порнография (даже с NSFW).
III.2) Жесть.
За нарушение I - предупреждение
За нарушение II - предупреждение и перемещение поста в общую ленту
За нарушение III - бан