Как заставить женщину работать на заводе при помощи ИИ
Я не знаю фотошоп. Но иногда в работе инженера очень нужно улучшить или изменить картинку! Особенно, когда начальство требует красивое изображение.
В этой статье я по шагам покажу, как при помощи бесплатной Qwen сделать хорошую картинку для отчёта или презентации, даже тогда, когда с первого раза не получается.
Женщина на заводе
Почти любой нейронке, работающей с изображениями, дорисовать какой-то объект – пару пустяков. Вот, например, женщина держит на руках коалу. А коала держит плюшевого крокодила. Это всё китайская нейронная сеть Qwen может.
Прелесть Qwen ещё в том, что она абсолютно бесплатная, нет никаких ограничений по количеству запросов и доступна в России без каких-либо танцев с бубном и подключении через впн.
А может ли эта нейронка нарисовать женщину в обстановке, какую я захочу? Например, на заводе?
От одного из проектов, у меня осталось фото узла с кусочком цеха на заднем фоне. Фотка – не ахти. Вполне себе начальная точка, чтобы покуражиться с искусственным интеллектом.
Заставить нейронку нарисовать женщину, работающую на заводе, по одной картинке и с одним промтом ещё нельзя. Но есть способ.
В Qwen есть возможность загрузить несколько картинок и попросить нарисовать что-то общее. Например, на фото с автомобилем (дорогим, конечно же!) с одной стороны нарисуй мужчину из файла 2 (конечно же моё фото).
Ещё более крутой вариант – это закинуть рисунок, сделанный, например, мышкой в Paint и попросить создать фотореалистичное изображение и сохранить позу из файла с рисунком.
Вторым вариантом я и воспользовался.
Загрузил и написал промт с просьбой объединить все эти три изображения:
Девушка-рабочий завода с первого фото стоит позади механизма (второе фото) и что-то с ним делает. Общая композиция как на изображении из третьего файла.
Qwen подумал и выдал такой результат:
Интересно. Но так себе. Влепил дизлайк этому результату и повторил генерацию. Итог тоже не очень, хоть уже типа «фотореалистично».
Зайдём с другой стороны. «Детский» рисунок нейронки явно лучше моего: лучше прорисован человек и собираемый узел; есть цвета. А что, если его закинуть в качестве основы композиции?
Закинул те же картинки, только свои каляки-маляки заменил на более продвинутые. Поменял промт:
Создай фотореалистичное изображение женщины, собирающей узел в цехе. Общую композицию нового изображения возьми с третьего файла. Женщина должна выглядеть как из первого файла. Изображение цеха и узла возьми из второго файла. При необходимости, дорисуй недостающие виды цеха.
И – о чудо! – получил то, что хотел! Женщина работает на заводе!
Короткий алгоритм
Подбери изображения объектов, которые необходимо объединить в одном изображении
При необходимости, нарисуй в Paint расположения этих объектов друг относительно друга
Напиши промт и отправь на генерацию. Вот структура промта:
Создай фотореалистичное изображение [КОГО] в [ОБСТАНОВКЕ]. Композицию возьми с файла [N]. Внешность — как на файле [N]. Окружение — как на файле [N]. Дорисуй недостающие детали
Если не получилось – экспериментируй с промтом и с изображениями
Что ещё делал в Qwen
Вообще, мне часто приходится делать различные картинки для презентаций: отчёты по ведению инновационных проектов, отчёты-сравнения конкурентов, слайды для тренингов. «Женщина на заводе» – это так, тестирование возможностей. А если серьёзно, то вот несколько примеров из моих проектов.
Есть изображение коробки переключения скоростей. Американская. Изображение – в изометрии. Даже с двух сторон! Но нужно изображение сбоку.
Есть вариант – запросить нужную проекцию. Но, во-первых, вы пробовали просить нужный вам вид конструкции с другого конструкторского бюро? А если у вас нет никаких контрактных отношений?
И, во-вторых. Держатель чертежей – США. Санкции.
Второй вариант – начертить самому и вращать как надо. Долго, муторно…
А что, если нейросеть? Людей хорошо рисует – может повернуть голову на изображении, опираясь на исходное фото в профиль или фас (а лучше грузить оба).
Но вот такой номер с «железками» почему-то не проходит. Даже при наличии достаточно полных видов (для инженера). Хотя для беглого взгляда вид может быть вполне достаточен.
Иногда бывает нужно раскрасить отдельные узлы в разные цвета. Нейронка красит. Делает это быстро. Но такая фигня получается…
А вот ещё одна задача: надо почистить фото от артефактов. Сделали фото с экрана монитора. И на фото получили рябь.
Загрузил это фото в Qwen, задал промт и получил результат. Если смотреть из далека, то результат – отличный. Но нейронка не смогла отличить содержание клеток от полос экрана и оставила последние внутри некоторых клеток. Надо быть внимательным к получаемому результату.
Итог
В целом, Qwen – хороший инструмент для редактирования картинок, предназначенных для статей, отчётов и презентаций. Но это его не основная функция. Вообще, эта программа больше заточена под работу с текстами: генерация идей, поиск информации (Perplexity в разы лучше, но и тут норм), упрощение рутины. Я этой нейросетью вместе с DeepSeek и Perplexity пользуюсь для поиска решений проблем с производства (например, пошёл брак, а что делать – не ясно) и по конструкции – что-то новое изобрести.
Что касается работы с картинками, то я «прошёлся по всем граблям» и собрал в один файл подборку промтов по обработке изображений для статей, отчётов и презентаций. Каждый промт снабжен примером (как на рисунке 10). И всё это можно скачать у меня в Телеграм-канале (или ВКонтакте – кому, где удобно). Заходите, забирайте (без регистрации и смс 😊).Ищите в закрепе Телеграм и в комментариях под закреплённым постом ВК.
На этих площадках я регулярно публикую подобные находки, лайфхаки по ИИ для работы и разбираю сложные кейсы. Присоединяйтесь!










Искусственный интеллект
5.6K поста11.8K подписчиков
Правила сообщества
ВНИМАНИЕ! В сообществе запрещена публикация генеративного контента без детального описания промтов и процесса получения публикуемого результата.
Разрешено:
- Делиться вопросами, мыслями, гипотезами, юмором на эту тему.
- Делиться статьями, понятными большинству аудитории Пикабу.
- Делиться опытом создания моделей машинного обучения.
- Рассказывать, как работает та или иная фиговина в анализе данных.
- Век жить, век учиться.
Запрещено:
I) Невостребованный контент
I.1) Создавать контент, сложный для понимания. Такие посты уйдут в минуса лишь потому, что большинству неинтересно пробрасывать градиенты в каждом тензоре реккурентной сетки с AdaGrad оптимизатором.
I.2) Создавать контент на "олбанском языке" / нарочно игнорируя правила РЯ даже в шутку. Это ведет к нечитаемости контента.
I.3) Добавлять посты, которые содержат лишь генеративный контент или нейросетевой Арт без какой-то дополнительной полезной или интересной информации по теме, без промтов или описания методик создания и т.д.
II) Нетематический контент
II.1) Создавать контент, несвязанный с Data Science, математикой, программированием.
II.2) Создавать контент, входящий в противоречие существующей базе теорем математики. Например, "Земля плоская" или "Любое действительное число представимо в виде дроби двух целых".
II.3) Создавать контент, входящий в противоречие с правилами Пикабу.
III) Непотребный контент
III.1) Эротика, порнография (даже с NSFW).
III.2) Жесть.
За нарушение I - предупреждение
За нарушение II - предупреждение и перемещение поста в общую ленту
За нарушение III - бан