2

Как заставить женщину работать на заводе при помощи ИИ

Я не знаю фотошоп. Но иногда в работе инженера очень нужно улучшить или изменить картинку! Особенно, когда начальство требует красивое изображение.

В этой статье я по шагам покажу, как при помощи бесплатной Qwen сделать хорошую картинку для отчёта или презентации, даже тогда, когда с первого раза не получается.

Женщина на заводе

Почти любой нейронке, работающей с изображениями, дорисовать какой-то объект – пару пустяков. Вот, например, женщина держит на руках коалу. А коала держит плюшевого крокодила. Это всё китайская нейронная сеть Qwen может.

Рисунок 1 - Женщина с животными на руках

Рисунок 1 - Женщина с животными на руках

Прелесть Qwen ещё в том, что она абсолютно бесплатная, нет никаких ограничений по количеству запросов и доступна в России без каких-либо танцев с бубном и подключении через впн.

А может ли эта нейронка нарисовать женщину в обстановке, какую я захочу? Например, на заводе?

От одного из проектов, у меня осталось фото узла с кусочком цеха на заднем фоне. Фотка – не ахти. Вполне себе начальная точка, чтобы покуражиться с искусственным интеллектом.

Рисунок 2 - Исходное фото

Рисунок 2 - Исходное фото

Заставить нейронку нарисовать женщину, работающую на заводе, по одной картинке и с одним промтом ещё нельзя. Но есть способ.

В Qwen есть возможность загрузить несколько картинок и попросить нарисовать что-то общее. Например, на фото с автомобилем (дорогим, конечно же!) с одной стороны нарисуй мужчину из файла 2 (конечно же моё фото).

Ещё более крутой вариант – это закинуть рисунок, сделанный, например, мышкой в Paint и попросить создать фотореалистичное изображение и сохранить позу из файла с рисунком.

Вторым вариантом я и воспользовался.

Рисунок 3 - Исходные изображения

Рисунок 3 - Исходные изображения

Загрузил и написал промт с просьбой объединить все эти три изображения:

Девушка-рабочий завода с первого фото стоит позади механизма (второе фото) и что-то с ним делает. Общая композиция как на изображении из третьего файла.

Qwen подумал и выдал такой результат:

Рисунок 4 - Результат первый. Аниме я не заказывал

Рисунок 4 - Результат первый. Аниме я не заказывал

Интересно. Но так себе. Влепил дизлайк этому результату и повторил генерацию. Итог тоже не очень, хоть уже типа «фотореалистично».

Рисунок 5 - Неудачное изображение женщины на заводе. Будет лучше

Рисунок 5 - Неудачное изображение женщины на заводе. Будет лучше

Зайдём с другой стороны. «Детский» рисунок нейронки явно лучше моего: лучше прорисован человек и собираемый узел; есть цвета. А что, если его закинуть в качестве основы композиции?

Закинул те же картинки, только свои каляки-маляки заменил на более продвинутые. Поменял промт:

Создай фотореалистичное изображение женщины, собирающей узел в цехе. Общую композицию нового изображения возьми с третьего файла. Женщина должна выглядеть как из первого файла. Изображение цеха и узла возьми из второго файла. При необходимости, дорисуй недостающие виды цеха.

И – о чудо! – получил то, что хотел! Женщина работает на заводе!

Рисунок 6 - Женщина работает на заводе

Рисунок 6 - Женщина работает на заводе

Короткий алгоритм

  1. Подбери изображения объектов, которые необходимо объединить в одном изображении

  2. При необходимости, нарисуй в Paint расположения этих объектов друг относительно друга

  3. Напиши промт и отправь на генерацию. Вот структура промта:

Создай фотореалистичное изображение [КОГО] в [ОБСТАНОВКЕ]. Композицию возьми с файла [N]. Внешность — как на файле [N]. Окружение — как на файле [N]. Дорисуй недостающие детали

Если не получилось – экспериментируй с промтом и с изображениями

Что ещё делал в Qwen

Вообще, мне часто приходится делать различные картинки для презентаций: отчёты по ведению инновационных проектов, отчёты-сравнения конкурентов, слайды для тренингов. «Женщина на заводе» – это так, тестирование возможностей. А если серьёзно, то вот несколько примеров из моих проектов.

Есть изображение коробки переключения скоростей. Американская. Изображение – в изометрии. Даже с двух сторон! Но нужно изображение сбоку.

Рисунок 7 - Автоматическая коробка переключения передач Alisson 2500 series

Рисунок 7 - Автоматическая коробка переключения передач Alisson 2500 series

Есть вариант – запросить нужную проекцию. Но, во-первых, вы пробовали просить нужный вам вид конструкции с другого конструкторского бюро? А если у вас нет никаких контрактных отношений?

И, во-вторых. Держатель чертежей – США. Санкции.

Второй вариант – начертить самому и вращать как надо. Долго, муторно…

А что, если нейросеть? Людей хорошо рисует – может повернуть голову на изображении, опираясь на исходное фото в профиль или фас (а лучше грузить оба).

Но вот такой номер с «железками» почему-то не проходит. Даже при наличии достаточно полных видов (для инженера). Хотя для беглого взгляда вид может быть вполне достаточен.

Рисунок 8 - Вид сбоку на коробку Allison 2500 series

Рисунок 8 - Вид сбоку на коробку Allison 2500 series

Иногда бывает нужно раскрасить отдельные узлы в разные цвета. Нейронка красит. Делает это быстро. Но такая фигня получается…

Рисунок 9 - Покрасили АКПП

Рисунок 9 - Покрасили АКПП

А вот ещё одна задача: надо почистить фото от артефактов. Сделали фото с экрана монитора. И на фото получили рябь.

Загрузил это фото в Qwen, задал промт и получил результат. Если смотреть из далека, то результат – отличный. Но нейронка не смогла отличить содержание клеток от полос экрана и оставила последние внутри некоторых клеток. Надо быть внимательным к получаемому результату.

Рисунок 10 - Улучшаем эмбрионы

Рисунок 10 - Улучшаем эмбрионы

Итог

В целом, Qwen – хороший инструмент для редактирования картинок, предназначенных для статей, отчётов и презентаций. Но это его не основная функция. Вообще, эта программа больше заточена под работу с текстами: генерация идей, поиск информации (Perplexity в разы лучше, но и тут норм), упрощение рутины. Я этой нейросетью вместе с DeepSeek и Perplexity пользуюсь для поиска решений проблем с производства (например, пошёл брак, а что делать – не ясно) и по конструкции – что-то новое изобрести.

Что касается работы с картинками, то я «прошёлся по всем граблям» и собрал в один файл подборку промтов по обработке изображений для статей, отчётов и презентаций. Каждый промт снабжен примером (как на рисунке 10). И всё это можно скачать у меня в Телеграм-канале (или ВКонтакте – кому, где удобно). Заходите, забирайте (без регистрации и смс 😊).Ищите в закрепе Телеграм и в комментариях под закреплённым постом ВК.

На этих площадках я регулярно публикую подобные находки, лайфхаки по ИИ для работы и разбираю сложные кейсы. Присоединяйтесь!

Искусственный интеллект

5.6K поста11.8K подписчиков

Правила сообщества

ВНИМАНИЕ! В сообществе запрещена публикация генеративного контента без детального описания промтов и процесса получения публикуемого результата.


Разрешено:


- Делиться вопросами, мыслями, гипотезами, юмором на эту тему.

- Делиться статьями, понятными большинству аудитории Пикабу.

- Делиться опытом создания моделей машинного обучения.

- Рассказывать, как работает та или иная фиговина в анализе данных.

- Век жить, век учиться.


Запрещено:


I) Невостребованный контент

  I.1) Создавать контент, сложный для понимания. Такие посты уйдут в минуса лишь потому, что большинству неинтересно пробрасывать градиенты в каждом тензоре реккурентной сетки с AdaGrad оптимизатором.

  I.2) Создавать контент на "олбанском языке" / нарочно игнорируя правила РЯ даже в шутку. Это ведет к нечитаемости контента.

  I.3) Добавлять посты, которые содержат лишь генеративный контент или нейросетевой Арт без какой-то дополнительной полезной или интересной информации по теме, без промтов или описания методик создания и т.д.


II) Нетематический контент

  II.1) Создавать контент, несвязанный с Data Science, математикой, программированием.

  II.2) Создавать контент, входящий в противоречие существующей базе теорем математики. Например, "Земля плоская" или "Любое действительное число представимо в виде дроби двух целых".

  II.3) Создавать контент, входящий в противоречие с правилами Пикабу.


III) Непотребный контент

  III.1) Эротика, порнография (даже с NSFW).

  III.2) Жесть.


За нарушение I - предупреждение

За нарушение II - предупреждение и перемещение поста в общую ленту

За нарушение III - бан

Темы

Политика

Теги

Популярные авторы

Сообщества

18+

Теги

Популярные авторы

Сообщества

Игры

Теги

Популярные авторы

Сообщества

Юмор

Теги

Популярные авторы

Сообщества

Отношения

Теги

Популярные авторы

Сообщества

Здоровье

Теги

Популярные авторы

Сообщества

Путешествия

Теги

Популярные авторы

Сообщества

Спорт

Теги

Популярные авторы

Сообщества

Хобби

Теги

Популярные авторы

Сообщества

Сервис

Теги

Популярные авторы

Сообщества

Природа

Теги

Популярные авторы

Сообщества

Бизнес

Теги

Популярные авторы

Сообщества

Транспорт

Теги

Популярные авторы

Сообщества

Общение

Теги

Популярные авторы

Сообщества

Юриспруденция

Теги

Популярные авторы

Сообщества

Наука

Теги

Популярные авторы

Сообщества

IT

Теги

Популярные авторы

Сообщества

Животные

Теги

Популярные авторы

Сообщества

Кино и сериалы

Теги

Популярные авторы

Сообщества

Экономика

Теги

Популярные авторы

Сообщества

Кулинария

Теги

Популярные авторы

Сообщества

История

Теги

Популярные авторы

Сообщества