OpenAI выпустили новую модель генерации изображений, интегрированную в GPT-4о и Sora. Теперь можно создавать и редактировать изображения внутри диалога, и это не DALL-E! Прямо как в Gemini и Grok, но с лучшим качеством и реализмом.
Сразу скажу — теперь можно рисовать изображения с текстом на русском, еще можно запоминать персонажа и рисовать с ним разные сцены. Изображения скачиваются в хорошем качестве в png.
Еще прикольно, что можно менять эмоции персонажей, помимо стандартных - удаление/замена фона, удаление/ добавление предметов. При том я попробовала на Илоне Маске, и Сэм Альтман не соврал, когда пообещал не ограничивать пользователей в творчестве.
Выдаёт PNG без фона — удобно для монтажа и дизайна.
Может еще менять стиль загруженного фото, и кто его знает, сколько у него еще областей применения. Вот тут подробнее можно изучить
Можно делать комиксы с русским текстом, можно делать агитплакаты в советском стиле. А можно генерировать:
дизайн упаковок для вымышленных гаджетов,
фирменный стиль для личного бренда,
мифологические или фэнтези-образы (эльфы, драконы, города будущего),
или даже дизайн интерфейсов для своих будущих приложений.
1. Обучающие комиксы и гайды
Можно делать короткие комиксы или пошаговые инструкции для сложных тем.
Пример: показать алгоритм работы нейронной сети в формате «комикса-истории», где персонажи (например, маленький робот и говорящая лампочка) пошагово объясняют принцип обратного распространения ошибки.
Промпт: Сгенерируй комикс из 4 кадров в мультяшном стиле, где герой-робот объясняет другому персонажу (смешному говорящему огоньку) принцип обучения нейросети на русском языке. На каждом кадре добавь короткую реплику от персонажей. Тематика комикса: пошаговая инструкция, дружелюбный и весёлый тон.
2. Винтажные «рекламные» плакаты будущего
Помимо советских плакатов, можно делать «рекламные постеры из будущего» в стиле стимпанк или ретрофутуризма, как пример: представить, как в 2080 году выглядят объявления о наборе студентов на курсы машинного обучения. Или как бы выглядел плакат о космическом туризме в стиле «беляевской» ретрофантастики.
Создай винтажный плакат в стиле ретрофутуризма (что-то среднее между советским агитплакатом и научной фантастикой 50-х). Тема: рекламный постер о космическом туризме на Марс. Текст на русском: «Марс ждёт тебя!» Добавь яркие оранжевые и красные тона, космонавта в старомодном скафандре и стилизованное изображение планеты на фоне.
3. Инфографика для объяснения сложных концепций
Можно создать схематичные изображения и простые диаграммы. Это может пригодиться в обучении, маркетинге или при подготовке презентаций.
Пример: сделать инфографику, где визуально показаны этапы работы вашего сервиса, сайта или бота — от сбора данных до получения результата.
Промпт: Создай инфографику в минималистичном стиле, состоящую из четырёх блоков. Каждый блок описывает этап разработки мобильного приложения:
1) Идея и анализ рынка,
2) Дизайн интерфейсов,
3) Разработка кода,
4) Тестирование и запуск.
Добавь короткие надписи на русском для каждого этапа, и используй приятные пастельные цвета.
4. Концепт-арт и продуктовые макеты
Можно создать быстрые визуальные концепции. Например, если вам нужно «набросать» дизайн упаковки продукта или набросок интерфейса приложения.
Пример: попросить ChatGPT 4o сгенерировать упаковку для вымышленного «умного» кофе, который подстраивается под биоритмы. Или придумать интерфейс «приложения для контроля сна» в стиле минимализм.
Промпт: Сгенерируй простой концепт-арт упаковки для «умного кофе» SmartCoffee. Упаковка в светло-зелёных тонах, с минималистичным логотипом в форме нейрона. Текст на русском: «SmartCoffee: твой заряд энергии». Стиль — современный, аккуратный, с намёком на высокие технологии.
Подпишитесь на НейроProfit и узнайте, как можно использовать нейросети для бизнеса, учебы и работы, не теряя свое время.
5. «Живые» персонажи и мультяшные ролики
Классно получается, когда ChatGPT 4o генерирует персонажей в разных стилях: от реалистичных портретов до анимешных героев.
Пример: сделать серию иллюстраций про виртуального помощника канала — например, доброго робота NeuralProfit, который отвечает на вопросы, даёт советы и рекламирует новые возможности.
Промпт: Нарисуй в стиле японской анимации персонажа-робота Неро Profit. Он выглядит дружелюбно, у него большая «лампочка» на голове, а на корпусе логотип нейросети. Фон — абстрактные элементы кода. Текст на русском: «Неро Profit всегда на связи!».
6. Раскладка мебели:
Возьми фото комнаты (гостиной), изобрази каждый предмет мебели и декора ( диван, растения, полки) отдельно на нейтральном фоне в стиле flat lay (вид сверху). Сохрани оригинальные цвета и пропорции, не добавляй предметы, которых нет на фото. Размести все объекты в отдельном файле так, чтобы они не перекрывали друг друга и были хорошо видны.
7. Раскладка одежды:
Сделай из фото, картинку в стиле flat lay с одеждой человека на изображении, включающая наиболее заметные элементы наряда с картинки. Одежда должна быть аккуратно разложена. Используйте только те предметы, которые человек носит на себе, и ничего более; не придумывайте одежду, которой нет на изображении. Убедитесь, что цветовая гамма соответствует оригиналу, включите все элементы одежды персонажа, но не добавляйте предметы, которые не видны на изображении
8. Раскладка ингредиентов:
На фото есть тарелка с несколькими блюдами. Покажи каждый ингредиент отдельно на нейтральном фоне сверху, сохраняя реальную форму и цвет. Не добавляй лишних продуктов, которых нет на тарелке. Стиль — минималистичная фуд-фотография.
9. Прозрачная иконка:
Generate a transparent image, a brain with atom, cartoon style, squared size.
10. Обложка Youtube
Используя референс обложки видео для ютуб, сделай обложку видео для ютуб с моим лицом. На фоне перечеркнутый логотип Adobe Photoshop и рядом светится логотип ChatGPT с кубком за первое место в руках.
11. Игрушка фрилансера
12. Афиша конференции
Создай афишу для конференции "НейроКон 2025". Стиль — динамичный, с элементами киберпанка и современного минимализма. На афише добавь крупный заголовок: "НейроКон 2025: Будущее уже здесь", а также абстрактные графические элементы, символизирующие искусственный интеллект.
13. Большой древний текст
Сделай изображение в стиле старинного пергамента, на котором будет точно и дословно воспроизведён следующий текст (на русском языке). Текст должен быть набран стилизованным шрифтом под древнюю рукопись, но при этом читабельным. Фон: состаренный пергамент с тёплым коричневатым оттенком.
Текст: аккуратно выровняй абзацы, сохрани орфографию и пунктуацию из исходного текста. Не добавляй и не удаляй слов.
Размещение: текст должен занимать центральную часть изображения, вокруг — свободное пространство.
Иллюстрации (если нужны): добавь небольшую виньетку или декоративный элемент (например, стилизованное перо или герб) внизу, не перекрывая текст.
<Сам текст>
Сюда вставляете большой текст
</Сам текст>
14. Микс нескольких изображений
Можно замиксовать несколько объектов или картинок в одно целое. Например, можно вставить свое фото и фото футболки и попросить надпись еще добавить, но лицо искажает.
15. Сгенерировать плакат:
Сначала в ChatGPT даем задачу:
Сделай слоганы в советском стиле для [телеграм канала НейроProfit]
Затем уже в другом диалоге ChatGPT 4o вставляете слоган в этот промпт:
Плакат в советском стиле с надписью [слоган]
SORA
Кто не знал, в Soraтоже можно создавать изображения, в том числе и с русским текстом, а заодно и анимировать - 3 видео в сутки бесплатно)
По поводу цензуры не все так просто. Например, мне дали сгенерировать Трампа и Маска, но вот ни целоваться, ни курить сигары политика компании не позволяет.
А так в целом можно спокойно сгенерить афишу какой-нибудь конференции и оживить буквы, добавить эффект молнии и т.д.
Кстати, вроде бы Sora для генерации видео или оживления изображения сделали бесплатным для всех. Отпишитесь, плиз, у кого нет подписки Plus, правда это или нет? Как я понимаю, лимит именно на видео из изображения, созданного в Sora 🤔
Подпишитесь на НейроProfit и узнайте, как можно использовать нейросети для бизнеса, учебы и работы, не теряя свое время.
Больше полезных, а главное проверенных сервисов для учебы, работы и бизнеса в моем Закрытом клубе. Там же мы учимся промптить, разбираемся в языковых моделях, помогаем друг другу с задачами. Смысл в том, что вы платите только один раз! Вам не нужно торопиться, пока подписка действует, вы можете учиться в своем темпе, и в любой момент задать вопрос в чате) А то всё быстро устаревает, а на постоянные обучения денег не напасешься, я это понимаю.
Заранее приготовьте фото для вашего будущего мокапа или сделайте их с помощью нейросети. Как сделать фото для мокапа с помощью нейросети я покажу в другой статье.
1. Откройте фото в фотошопе Файл - Открыть
2. Я взяла фото карточки рассадки сделанное с помощью ИИ. С помощью инструмента Прямоугольник, белым цветом залейте приблизительную область
3. Кликнув ПКМ по созданному слою нажмите Преобразовать в смарт-объект
4. Используя Редактирование - Трансформирование контура - Искажение растягиваем прямоугольник в точности на нужную область, при необходимости можно использовать другие варианты Трансформирования.
5. Нажав два раза на значок смарт-объекта, откроется то куда можно поместить свой дизайн.
С помощью Файл - Поместить вставляем дизайн. Я выбрала что-то из старых своих леттеринг-работ формата PNG без фона.
Не забудьте выключить цвет прямоугольника, чтобы он не отображался на дизайне и можно немного подредактировать надпись.
С помощью CTRL + S обновляем дизайн и возвращаемся к файлу мокапа. Сохраняем готовый мокап.
Ок. Я отдал постоянному заказчику фото с его мероприятий. В течение месяца ждал оплату. Молчание стало угнетающим. На мои призывы назвать сроки - кормление завтраками.
Но, как только я написал заказчику что его заказчик - депутат Госдумы РФ - завтра получит письмо о том что депутат использует в своих медиа ресурсах мои неоплаченные - ворованные фотографии. Оплата поступила в течение часа.
В 2014-м я ушла «на фриланс». Нужно было выбрать специализацию — невозможно одинаково хорошо делать всё. Я проанализировала свой опыт и поняла, что лучше всего у меня получаются фуд‑зоны для упаковок. Коллеги это отмечали, арт‑директора хвалили композиции из фруктов. Сделала на это ставку.
Эту историю для моего блога рассказала Анна Макарова, математик и фуд-иллюстратор.
ВМиК и "кризис подлинности"
Я училась в физматшколе при НГУ, в него же и поступила потом на математический факультет, но по семейным обстоятельствам переехала в Москву и перевелась в МГУ на ВМиК.
К концу обучения стало ясно, что работа в науке — не совсем то, чего я хочу. Олимпиадные задачки и математические игры — это одно, а серьезные численные методы – совсем другое. И тут произошла революция в издательском деле: массовый переход на компьютерные станции. Издательствам срочно потребовались специалисты, умеющие работать с компьютерами. А у меня к этому времени проявилась вторая сторона — художественная. Я с детства рисовала, но это всегда оставалось на втором плане после точных наук.
Так я попала в редакцию журнала «Киносценарии». У них стоял новенький Apple Macintosh, и никто не понимал, как к нему подступиться. Им нужен был человек, который разбирается в компьютерах и интересуется графическим дизайном. Первые сутки я сама не знала, что делать и как начать работать с программами верстки. Попросилась поосваивать машину на выходных — получилось «fake it till you make it».
Потом я работала в других издательствах, типографиях, а в итоге — в крупных рекламных агентствах. Мы делали всю рекламу — от косметики до автомобилей. Параллельно я получила второе высшее образование — «Дизайн средств массовой информации и коммуникации» (тоже МГУ). Защитила диплом на тему «Кризис подлинности в современной массовой культуре» (это тогда еще нейросетей не было!).
В 2014-м я ушла «на фриланс». Нужно было выбрать специализацию — невозможно одинаково хорошо делать всё. Я проанализировала свой опыт и поняла, что лучше всего у меня получаются фуд‑зоны для упаковок. Коллеги это отмечали, арт‑директора хвалили композиции из фруктов. Сделала на это ставку.
Особенности фуд-иллюстрации
Главный секрет хорошей съедобной картинки — аппетитность. Это как сверкание граней в ювелирных изделиях — никому не нужны тусклые бриллианты, и точно так же никому не нужна неаппетитная еда.
Но если нехватку блеска в украшениях легко описать словами, то с аппетитностью сложнее. Разную еду делает аппетитной разное. Фактически, существуют только проявления неаппетитности, и если их все убрать, картинка заиграет:
Серые оттенки портят впечатление — еда должна быть яркой
Кривая форма отталкивает — еда должна быть ровной
Недостоверность в деталях настораживает
Неправильные блики делают еду "пластиковой"
Неестественные тени убивают объем
Слишком идеальная картинка вызывает недоверие
Нейро-картинка имитирует далеко не любительскую фотографию: есть свет, композиция, стиль.
Но для меню два-три ролла — уже странность. И почему кучка зелёной икры лежит между ними? Ведь на каждом должна быть своя. И почему, выбирая всего лишь два ролла, автор фото взял экземпляр с такой некрасивой серединкой?
Нейросети — новый способ работы с изображениями
Я работаю с нейросетями третий год, и главное, что поняла — это не просто новый инструмент. Это принципиально иной способ создавать иллюстрации.
Раньше для создания фуд-иллюстрации у меня было несколько путей:
Сфотографировать продукт самой
Получить фотоматериалы от клиента
Сделать иллюстрацию с нуля по скетчам или референсам
С появлением Midjourney процесс изменился. Теперь я начинаю с генерации базовых изображений. Но это не "нажал кнопку — получил результат". Нейросеть капризна, картинка не поддается полному контролю. Нужен многолетний опыт иллюстратора, чтобы довести сгенерированное изображение до коммерческого качества.
Я провожу отбор перспективных генераций и показываю заказчику несколько десятков сразу на доске.
Фактически, сейчас я генерирую в Midjourney исходники, а потом в фотошопе, опираясь на опыт, довожу их до финала. Это похоже на прежний процесс, когда я брала фотографии как основу — только теперь у меня гораздо больше контроля над исходным материалом.
В итоге сейчас я работаю по двум схемам:
Основная работа идет в нейросети, а фотошоп на подхвате: исправляю ошибки, довожу детали до нужного качества
Основная работа идет в фотошопе, а нейросети на подхвате: генерирую в Midjourney кусочки изображения, ретуширую с Adobe Firefly, встроенном в фотошоп.
Во второй схеме нет ничего революционного — просто обновление инструментов. Это влияет только на скорость работы, иногда очень существенно. Например:
Раньше на рисование текстуры такой зефирки уходило два часа
Теперь генерация и доработка занимают 30 минут
Все задачи можно решить мышкой, без рисования вручную
Сделала 3D-модельки цилиндров – будущих зефирок маршмеллоу. Утвердили расположение, применила функцию retexture в Midjourney, получила готовый кусочек иллюстрации, поставила в фудзону.
Некоторые задачи стали решаться в разы быстрее. Например:
Текстура бисквита раньше требовала часов монотонного рисования
Сложные композиции приходилось собирать из множества фотографий
Капли и блики рисовались вручную
Светотень на объектах прорабатывалась послойно
Сейчас это всё можно сгенерировать, а потом доработать. Но появились и новые сложности...
Где нейросеть проиграла кожаным
Если вам нужна конкретная вещь, в конкретном положении, это оговорено с заказчиком и есть в ТЗ, — совсем не факт, что для нейросети это ТЗ можно сделать понятным. Вот нужна мне была кедровая шишка, но нейросеть всё время подсовывала еловые и сосновые — они более популярные. В такой ситуации бессмысленно пытаться пробить стену, нужно искать обходные пути.
Помогло следующее:
Уже в фотошопе применяем Generative Fill с референсом.
Используем генерацию из Midjourney с каким-то шишечным мутантом. Его ценность в ракурсе и перспективе, он приемлемо лежит в композиции.
А теперь поверх него генерим шишку с промтом cedar cone и картинкой-референсом: каноничной кедровой шишкой из стоков.
Эта шишка совсем иначе расположена, но в том и магия, что нейронка берет её и "поворачивает". Доделать тени, и задача решена без фотосъемки.
Это делает Generative Fill (он же Firefly), встроенный в фотошоп.
Финальный результат.
Что еще не получается у Миджорни?
Турецкая турка — нейросеть не понимает её конструкцию
Пельмени — не может сделать правильную форму, которую так ценят производители
Наполовину очищенный банан никогда не будет красивым
Бокал вина, наполненный до краев — невозможно получить, без шансов
Обычный трехлепестковый лист клевера — скорее всего, подсунет «счастливый» четырехлепестковый
Простой советский подстаканник, настоящий тульский пряник и другие локальные темы национальной кухни (гречневая каша, сушки, холодец, простокваша, селедка под шубой — скорее всего, будет фантазировать что‑то своё).
Физика, оптика, законы материального мира — все это пока неподвластно нейросетям на сто процентов. С этими задачами справляются «лоры» (LoRA, дообучение) во Flux. Миджорни менее управляема в этом смысле, но картинка в ней получается живее и ярче.
Где нейросеть победила кожаных
Нейросеть умеет ловить мгновенье
Заказчик захотел иллюстрации с продуктом на фоне владивостокских ландшафтов. Я сгенерила несколько красивых картинок, доработала их до финального вида в фотошопе, поставила упаковки.
Что тут важно: обратите внимание, насколько сложной была бы фотосъёмка этих сюжетов. Мороженое всегда тяжело снимать, даже в студии. А на ярком солнце?
Почти нереально.
А второй сюжет это красивый закат, стремительно уходящая натура — тоже трудность.
Всего мы сделали 12 сюжетов для разных вкусов продукта, в разных ситуациях употребления. В каждом сюжете встречали свои трудности, нейросети помогли все их решить. Каждый раз работа стартовала с пристрелочных генераций.
Обычный вид доски в разгаре работы над проектом.
Еще один пример сложного сюжета — всплески жидкости. Молоко, йогурт часто нужны на упаковке. Брызги воды тоже очень популярны.
Чтобы получить нужный для такого сюжета фотоматериал, фотограф должен иметь оборудованную студию, желательно с «мокрым столом». Да и тогда подловить нужную форму всплеска непросто. Бюджет раздувается либо от гонорара фотографу, либо от оплаты часов ретушеру, который будет потом собирать из отдельных кадров приемлемый всплеск. Я как раз и занималась такой работой в донейросетевую эпоху.
Поэтому, когда удалось придумать и оттестировать новый процесс для такой задачи, он сразу пошел в дело на нескольких проектах.
В чем суть. Представьте, почти готов макет принта, есть объект, а вокруг предполагается всплеск. Пока он существует в воображении директора, он может начертить его контур, воплощая все свои представления о гармонии и композиции. И в этот момент задача сразу становится нетривиальной, потому что абы какой всплеск сюда не подойдет.
Теперь, с нейросетями, она решается. Не "одной кнопкой", но точно без мокрого стола.
Давайте покажу, как это делаю с помощью миджорни и фотошопа:
Первый ИИ, который нам нужен - это Adobe Firefly, нейросеть, интегрированная в Photoshop и функционирующая как инструмент Generative Fill:
Обведите всплеск выделением и введите промт. Вы можете включать и выключать слой эскиза, чтобы увидеть, что лучше работает именно на вашем изображении.
Желательно менять текст, используя разные варианты. Потребуется несколько попыток, прежде чем всплеск получится приемлемым. Выберите лучший.
Теперь перейдем в Midjourney:
Стиль всплеска можно изменить. Возьмем изображение с предыдущего этапа+ всплеск нужной формы. Подберите картинку, обращая внимание на пластику жидкости и другие детали. Загрузите оба изображения в Midjourney.
Генерируйте, пока не соберется достаточно материала. Используйте несколько референсов сразу. Используйте image prompt, a также --sref, --iw, --sw, --s, --style raw.
Готовый всплеск можно улучшить, если добавить тонкую контрастную обводку по краю всплеска.
Нейросеть победила в быстром размножении стилистики
Недавно в Midjourney появилась функция moodboards — можно собрать несколько картинок, дать нейросети «сварить» из них нечто общее и начать получать изображения в этом стиле.
Я сделала доску из нескольких акварелек, которые когда-то рисовала для дизайна свадебных приглашений, сохранились хорошие хайрезы этих роз.
Потом я докидывала в тот же датасет удачные генерации, полученные с помощью --sref. А потом – генерации уже с самой доски. Важно в итоге отбалансировать всё так, чтобы ничего не перевешивало. Вот, что получается в итоге:
Казалось бы, базовая модель и так может генерировать картинки в любом стиле, зачем этот «довесок»? Но нет, если хочется отстроиться от повсеместного нейро‑ширпотреба, стоит вложиться в дообучение. Midjourney очень восприимчива и позволяет добиться практически чего угодно, особенно с последними мощными функциями, такими как retexture и moodboards.Что немаловажно, генерации по мудборду даже снижают необходимость черипикинга, что всегда приятно.
Сравните для примера генерации по одинаковым промтам, но в одном случае с кодом персонализации мудборда (слева), а в другом — просто со словом watercolor (акварель) в промте (справа).
<Рекомендации при работе с этой функцией>
stylize можно повышать, слегка или до упора (300-1000), это иногда помогает усилить влияние стиля, но не всегда;
на неквадратных форматах иногда стиль слетает и выпадает в фотографию, тогда можно тоже повышать --s или в крайнем случае аутпентить из квадратов, с которыми осечек гораздо меньше;
чем длиннее промт, тем меньше стабильности, так что лучше промтить взвешенно;
в начале промта можно ставить "подсказку", одно-два слова, помогающее доске вспомнить свое предназначение. Например, если это акварель, можно вначале вписывать watercolor;
"хаос" (--с ) с мудбордами работает и полезен, а "странность" (--w) — нет.
сейчас мудборды уже можно использовать совместно, иногда это дает особенно хороший результат;
</Рекомендации при работе с этой функцией>
<Лирическое отступление про промтинг>
Когда-то, в далеком 2023, когда юные промт-инжиниры только-только освоили это необыкновенное искусство складывать токены в промты, будущее казалось им безоблачным и долгим. Но уже тогда раздавались голоса о том, что этой профессии отсчитан короткий век, и скоро звезда промтинга закатится.
Самые едкие скептики сравнивали ее с лифтерами, мальчиками, которые когда-то нажимали кнопки в лифтах, пока пассажиры не научились нажимать эти кнопки самостоятельно.
И вот, действительно, что‑то подобное можно заметить. Появились и развились дополнительные инструменты, которые делают сам промт не настолько важной частью процесса генерации. Однако пока все еще неотьемлемой.
Поэтому стоит помнить про культуру промтинга. Существует обидное прозвище «boomer prompts» — так презрительно называют раздутые, перегруженные мусором промты. Избегайте такого. Промт должен быть сухой, поджарый, чтобы каждое слово в нем имело вес и оказывало явное влияние на генерацию.
</Лирическое отступление про промтинг>
Нейросеть победила в скорости выполнения однотипной задачи
Кроме stand-alone нейросетей уже возникли и развиваются многочисленные площадки, на которых их можно собирать в цепочки. Такие конструкты выполняют узкую, но комплексную задачу, с которой по‑отдельности ни одна из нейросетей‑участниц не справилась бы.
К примеру, известный сайт с «глифами». Я экспериментировала на нем, пока он был бесплатный, и сделала парочку достаточно причудливых глифов ради обучения и из любви к искусству. Считаю, что на эти цели очень полезно тратить время.
Мне вдруг пришло в голову, что было бы здорово заставить нейросети подбирать еду к гексаграммам из китайской Книги Перемен. Вот как работает мой глиф:
1. Первым случайным образом выпадает таинственный символ гексаграммы, состоящий из палочек. Здесь была техническая сложность: я хотела, чтобы символы выглядели как настоящая каллиграфия тушью, с неровностями мазков. Создавать 64 разные картинки показалось нерационально, поэтому я сделала восемь базовых элементов‑триграмм, просто нарисовала их в виде цифровых иллюстраций и загрузила jpeg файлы. Планировала собирать символы из двух половинок, но нейросети в одном случае из десяти путали верх с низом. Только когда я загрузила в глиф полный список гексаграмм с точным указанием их структуры, программа заработала корректно.
2. Далее GPT-4 определяет номер гексаграммы по выпавшему символу и на основе списка.
3. Claude-3.5-sonnet формирует интерпретацию гексаграммы, опираясь на древние знания и китайские тексты.
Например, для гексаграммы №60 "Ограничение" он предложил: "Подобно тому, как вода находит естественные границы в сосуде, этот момент требует сознательной умеренности и четких границ для поддержания гармонии и предотвращения нарушения естественного порядка излишествами".
4. Следующий Клод создает промт для генерации изображения еды, вдохновляясь полученной интерпретацией. Он придумывает блюдо, которое должно отражать смысл гексаграммы.
5. Для финальной генерации картинки использую Flux dev — он лучше других балансирует между реалистичностью и символичностью.
6. Завершающий штрих: мудрость-афоризм вверху изображения, вокруг все той же гексаграммы, опять Клод.
В результате получается композиция из каллиграфического символа гексаграммы, её номера и названия, плюс блюдо-иллюстрация и философская фраза для медитации.
Армия в такой интерпретации — это армия роллов, а Семья получает сытную курочку.
Новая экономика иллюстраций
Изменение процесса потребовало пересмотреть подход к ценообразованию. У меня сложилось две модели:
При работе в первой схеме, где нейросети только помогают:
Обычная ретушь идет по стандартной почасовой ставке.
Иллюстрации продаю по прайсу, привязанному к размеру, клиенту отдаю результат, а не процесс. Для клиента стало чуть интересней, потому что работа делается быстрее.
Вторая схема, где основная работа идет в нейросети, потребовала нового подхода:
Сначала беру время на "препромтинг" — пробую, возможно ли вообще выполнить задачу, это бесплатно
Творческий этап поиска "работающего промта" оплачивается по времени и дорого
Готовые картинки оцениваются поштучно и дешево
Финальная доработка обычно идет как бонус, либо переходим на обычную почасовку
Проект может закончиться просто передачей промта клиенту, чтобы он генерировал сам. Но на практике так почти не бывает — довожу работу до конца я. Чем эффективнее был первый этап, тем меньше времени уходит на отбор удачных вариантов.
Важно и другое: теперь я не могу сразу гарантировать клиенту, что его задачу точно удастся выполнить. Это принципиально меняет психологию работы, к которой я привыкла за много лет. Приходится больше общаться, объяснять технологию, консультировать. Но это тоже часть новой реальности.
Иллюстрация как международный бизнес
Я начала работать с зарубежными клиентами около десяти лет назад. Мы собрали базу контактов дизайн-студий и агентств по всему миру, отталкиваясь от победителей конкурсов. В этой задаче очень много на себя взял мой муж. Мне сложно придумывать креатив для рассылок, привлекать новых клиентов, но фрилансеру не выжить без такого. И еще, как бы ты ни был успешен в текущих проектах, если не поддерживать контакт с уже состоявшимися заказчиками, не выстраивать работу по их базе, не информировать о появившихся услугах, о тебе могут забыть. В тот момент муж очень помог на старте. С тех пор периодически берет на себя эти фрустрирующие задачи, и эта помощь неоценима.
Сфокусировались на студиях, которые занимаются упаковкой и фуд-иллюстрацией. Сделали рассылку примерно на тысячу адресов — это принесло первые заказы почти со всех континентов.
За годы работы сложилась любопытная картина национальных особенностей, многие совпали со стереотипами, как ни забавно это было обнаружить:
Америка и Австралия
Американцы работают быстро, с конкретными вопросами и позитивом
Тайминг такой, что параллельно ничем не заняться
Не торгуются, разве что для проформы
Австралийцы похожи, только любят смайлики и могут что-то забыть
Европа
Испанцы душевные, но с бюджетами не очень
С немцами сложно из-за овер-дотошности
Французы не готовы общаться на английском
Жители балтийских стран внятные, приветливые и никогда не спешат
Азия
Японцы вообще не идут на контакт
Китайцы никогда не рассказывают про проект целиком
Могут не представиться полным именем, вместо фамилии — название студии
Общение как с колл-центром: ты винтик, и они винтики
Сейчас у меня два основных направления: работа с западными клиентами и с российскими. Между ними ощущается водораздел, прежде всего в характере коммуникации. Это так сильно на все влияет, что я даже специально адаптировала свои промо-сайты, существенно поменяла tone-of-voice. Когда-то я нацеливалась на западных — просто из-за того, что они были готовы платить больше, сейчас цены сравнялись.
Проблемы с заказчиками
За всё время работы с иностранными клиентами у меня было всего несколько случаев с неоплатой. Самый необычный — фермеры из Новой Зеландии, которые выращивали сливы. Им понравилась моя работа, они прислали предоплату и заказали похожую иллюстрацию. Я сделала, но вторую часть оплаты они не прислали. При этом продолжали переписываться и просили войти в положение — урожай слив не задался, а мне обязательно должен помочь бог. С Новой Зеландией особо не посудишься, так что пришлось отпустить их спасать сливы. Обещали заплатить $200, когда дела наладятся.
Еще был случай — с арабским предпринимателем. Человек выглядел серьезно: рассказывал про свой стартап мороженого, созванивался, стоя в костюме на фоне дубайских небоскребов. История та же: заплатил предоплату, получил работу, а остаток в $400 «забыл» оплатить. В отличие от фермеров‑христиан, просто грубо замолчал.
Я собрала информацию, все данные по проекту, проконсультировалась с юристом насчет возможности судиться. Юрист отговорил — слишком сложно для такой суммы иска.
Было еще пара неприятных моментов, разных шероховатостей процесса, но в целом мой опыт не подтверждает многих страхов о том, как часто обманывают заказчики. Конечно, нужно быть начеку, не соглашаться работать без предоплаты, без договора, это позволит сохранить прежде всего здоровые нервы, так необходимые художнику. Но и пугаться любой тени не стоит, люди, как правило, заказывают картинки не для того, чтобы обмануть.
Почему не стоки?
Работа на стоках всегда казалась заманчивой альтернативой, и я даже предпринимала пару попыток на них выйти. Нейросети добавили эффективности в процесс, поэтому сразу же возникли мысли, а что если опять попробовать ворваться. Конечно, не у меня одной. И в этом и проблема. Ситуация на всех стоковых площадка сейчас одинаковая: все затопила лавина нейро‑контента. Всплыть сквозь эту толщу новичку практически нереально. Даже бывалые стокеры, с крепким многолетним портфелем, ощущают на себе давление этого шторма.
Площадки стремятся выкупать контент у стокеров для обучения своих ИИ! Самые редкие и трудоемкие лоты площадки как раз и вынимают из портфелей у стокеров для этого обучения, оставляя только то, что малоконкурентно и имеет плохие перспективы на продажу. Например, если фотограф принес на площадку людей в движении — скорее всего сток заберет такую работу себе на обучение, а вот статичных моделей разрешит на продажу. Это логично, так как нейросетям надо закрывать свои пробелы! Но по отношению к стокерам — похоже на грабеж… Платят им за этот контент для обучения копейки.
При этом часто у площадок очень жёсткие требования по авторскому праву. Нельзя ничего чужого, даже «идею», что бы это ни значило. И вот, например, мои коды, промты они боятся брать. На все нужен документ, или «релиз», есть такое понятие. Буквально, например, подтверждающие видео, как кто‑то сидит водит кисточкой и делает картинку.
Авторское право
Пятнадцать лет назад я сделала иллюстрацию стаканчика с кислородным коктейлем. Она получилась настолько удачной, что постепенно стала чуть ли не стандартом для этого продукта. Я встречала свой стаканчик и в столице, и в провинции, и даже в соседних странах. Он подмигивал мне с вывесок и баннеров. Им же нафарширована и выдача в поиске.
Что чувствует автор, когда внезапно встречает свое произведение там, куда его не помещал? У меня это вызывает три реакции:
Радость — самая быстрая реакция, чистый эндорфин. Это обычное тщеславие, но позитивное и наивное. Приятно, что людям нравится твое искусство
Неловкость — когда осознаешь, что картинку стянули. Сложно поверить, что люди не знали, что так делать нехорошо
Снисходительность — в конце концов понимаешь, что это пустяк в нашем грешном мире. Да пусть тот, кто никогда не закрашивал вотермарки, первым бросит камень!
Теперь, когда появились нейросети, тема авторского права стала еще острее (важно только не путать его с коммерческим). Но чем глубже я в нее погружаюсь, тем яснее понимаю: авторское право — это юридический пузырь, который обязан когда-то лопнуть. Возможно, нейросети пришли как раз для этого.
По своей природе авторское право — не право, которое следует юридически защищать, а категория совести. Художник, публикуя работу, уже отдает ее, как Прометей огонь. Боишься — не отдавай. Отдал — не бойся!
Если бы вместо унылых клонов моего стаканчика с кислородным коктейлем я увидела, как кто-то его творчески преобразовал, я бы только порадовалась. Неважно, нейросетью это сделано или чем угодно — важно движение, развитие, жизнь.
Сейчас все больше возможностей проверить эти убеждения на практике.
Я часто бываю в противоположной роли — того, кто должен решить, где грань между воровством и этичным заимствованием. Заметила, что голос совести действительно многое определяет. Например, стало очевидно, что даже мысли, не говоря про попытки "снять" нейросетью стиль какого-то конкретного художника сразу же вызывают дискомфорт. Совесть протестует! Но если пойти более культурным во всех смыслах путем, собрать референсы из разных источников, разных авторов, обучить нейросеть на этом массиве, внося попутно какое-то влияние своей собственной души, тогда совсем другое дело. Такой процесс захватывает и вдохновляет.
Я веду блог «Сегодня без ИИ, а завтра без работы». Рассказываю истории людей, которые используют нейросети в работе и жизни уже сегодня. Сейчас там одна статья, но скоро выйдут новые. Подпишись, чтобы не пропустить.
Привет! Захотелось новенького, вот и решил покреативить. Пара вечеров – и готово! Представляю вам: 5 полезных таблеток для фрилансеров, особенно дизайнеров. На все случаи жизни, даже самые безнадёжные.
Шрифты использовал компактные — идеально подходят для небольших задач, типа карточек товаров или упаковки проектов. Название шрифтов указано в верхнем левом углу. На то мы и секси-шрифт.
Этот и другие кириллические шрифты можно загрузить в вк или телеге Телега | Вконтакте
У нас сканер и принтер настолько точно копирует цвета документов, что мы с трудом их отличаем и поэтому всегда делаем пометку. Так же и с лицензиями: мы делаем копию и вставляем её в рамку - издали не отличить, а оригинал хранится в сейфе. Даже подпись шариковой ручкой выглядит очень натурально на копии. Поэтому мы всегда отказываем тем, кто хочет что-то "подправить" в документе. Зачем нам это надо? Торговать совестью за 3 копейки? Просили: поменять фамилию в доверенности на получение грузов, продлить доверенность, поменять фамилию в договоре поставки - всё это: сразу - нет. Объясняют, что это типа ничего страшного, работник заболел, почта подвела и т.д. Но нам такое не надо. И вам не советую: на этом не разбогатеешь. Хороший фотошопер всегда может подзаработать, а плохой - легко присесть...
Приходит ко мне лет 7 назад товарищ Майор, и рассказывает: - Гражданка П. подала в банк поддельные документы для получения кредита, а конкретно поддельную справку 2НДФЛ, коим действием совершила уголовно наказуемое деяние, эту справку 2НДФЛ по её показаниям изготовили в вашем офисе. Так что стройте всю вашу преступную группу изготовителей фальшивых документов, будем оформлять протоколы, ах да, компьютеры мы изымаем как вещественное доказательство.
Садится и начинает не задавая вопросы заполнять протокол опроса, пишет и проговаривает: Гражданка П. обратилась ко мне с просьбой изготовить ей документ 2НДФЛ с заведомо завышенными суммами дохода для подачи в банк и получения обманным путём денежных средств в виде кредита. Я изготовил ей этот документ за 100 рублей которые она мне оплатила наличными. Изготавливая документ я не подозревал что нарушаю закон о подделке документов...... расстрелять.
Стоп говорю товарищ Майор, вы немножко не то пишите, на самом деле было так: Гражданка П. обратилась в офис основным видом деятельности которого является создание и отправка всех видов налоговой и и иной отчётности в бумажном и электронном виде, (см. табличку на входе) в том числе и отчётности по форме 2НДФЛ. Гражданка попросила распечатать ей заполненный бланк 2НДФЛ. Реквизиты работодателя, суммы доходов были заполнены с её слов. Достоверность указанных сведений я не проверяю, проверяет налоговая или служба безопасности банка. Я не спрашиваем куда будет передан распечатанный бланк, мне это не интересно. Хочу особенно дополнить, что гражданке П. здесь не был изготовлен ни один документ, а тот бланк что получила П. стал документом когда его заверил работодатель подписью и печатью.
Вздыхает, заполняет новый протокол на мой мотив и уходит. Пока не посадили..
Господа юристы, прошу у вас помощи. Работаю на фрилансе на фотошопе и часто ко мне обращаются люди для внесения изменений в различных документах, таких как банковские чеки, справки о переводе денег ну и прочее, иногда это просто сканы каких то бумажек иногда скриншоты из приложений или пдф файлы. Иногда это бумаги иностранных государств - сертификаты или дипломы.
Все правки делаются только в электронных jpg или pdf файлах
Является ли это уголовно наказуемым деянием с моей стороны? Стоит ли мне избегать такие заказы?