Kling выпустил свою «нано банану» — IMAGE O1
Это вторая модель в линейке Omni после видео-модели O1. По сути, теперь Kling закрывает все базовые задачи для визуального контента — на уровне продвинутых платформ: от сторибордов и генерации сцен до точечных правок, предметки, портретов и стилизации.
Собрал главное, что нужно знать.
1. Это дешёвая модель. Особенно если сравнивать с Nano Banana Pro, она стоит примерно в 5 раз меньше, но закрывает все базовые задачи для визуала: генерацию, правки, стили, предметку, портреты. А на сайте Kling вообще дают ежедневно 160 кредитов, при цене генерации 2 кредита.
2. MVL. Модель работает в единой мультимодальной системе (MVL) и понимает одновременно текст и изображения. На вход можно дать до 10 картинок — персонажи, стиль-референсы, предметы, фоны — и модель учитывает их взаимосвязь при сборке финальной сцены.
3. Точные правки по запросу. Можно добавить или убрать объект, изменить размер, материал, цвет, фон или эмоцию — при сохранении исходного света и стилистики. Правки работают не только через текст, но и через выделение, стрелку или простой набросок.
4. Киношные возможности: модель меняет ракурс персонажа (фронт, профиль, 3/4, сверху, снизу), управляет высотой камеры и крупностью плана, настраивает освещение и корректирует эмоции. Подходит для сторибордов, CG и постановочных сцен.
5. Обещают супер консистентность. Модель держит портретное сходство, пропорции и стиль, а ключевые признаки сохраняются даже при смене ракурса, позы, одежды, окружения или света. Что очень важно для нейрофотосессий.
6. Коммерция и реклама. ИИ делает полноценную предметную съёмку — товары на мраморе, стекле или ткани, реалистичные материалы, тени и студийный свет. Есть виртуальная примерка: замена одежды, перенос обуви и аксессуаров между моделями с сохранением всех деталей и точным позиционированием в сцене.
Итог: подписку на Google AI Pro можно спокойно отменять, особенно если вам не нужны картинки с погодой в реальном времени. Во всём остальном IMAGE O1 точно не хуже — а если отбросить хайп, местами и лучше. Но нужны тесты. Много тестов!
Поэтому, уже завтра начну тестировать нейронку на предмет того, как она держит портретное сходство.
Искусственный интеллект
5.1K постов11.5K подписчика
Правила сообщества
ВНИМАНИЕ! В сообществе запрещена публикация генеративного контента без детального описания промтов и процесса получения публикуемого результата.
Разрешено:
- Делиться вопросами, мыслями, гипотезами, юмором на эту тему.
- Делиться статьями, понятными большинству аудитории Пикабу.
- Делиться опытом создания моделей машинного обучения.
- Рассказывать, как работает та или иная фиговина в анализе данных.
- Век жить, век учиться.
Запрещено:
I) Невостребованный контент
I.1) Создавать контент, сложный для понимания. Такие посты уйдут в минуса лишь потому, что большинству неинтересно пробрасывать градиенты в каждом тензоре реккурентной сетки с AdaGrad оптимизатором.
I.2) Создавать контент на "олбанском языке" / нарочно игнорируя правила РЯ даже в шутку. Это ведет к нечитаемости контента.
I.3) Добавлять посты, которые содержат лишь генеративный контент или нейросетевой Арт без какой-то дополнительной полезной или интересной информации по теме, без промтов или описания методик создания и т.д.
II) Нетематический контент
II.1) Создавать контент, несвязанный с Data Science, математикой, программированием.
II.2) Создавать контент, входящий в противоречие существующей базе теорем математики. Например, "Земля плоская" или "Любое действительное число представимо в виде дроби двух целых".
II.3) Создавать контент, входящий в противоречие с правилами Пикабу.
III) Непотребный контент
III.1) Эротика, порнография (даже с NSFW).
III.2) Жесть.
За нарушение I - предупреждение
За нарушение II - предупреждение и перемещение поста в общую ленту
За нарушение III - бан