Попробуй, заставь нейросеть сделать то что тебе нужно
В прошлом году договорился сделать заставку для странички стрима с помощью нейросети. Я вообще не художник и не дизайнер и поэтому было интересно — а может ли человек с нулевыми навыками в графике только с помощью нейросети что-то сделать и насколько это будет сложно. Нейросетку решил использовать Midjourney
На текущий момент скорее всего и Midjourney уже эволюционировала, и профи промт художник гораздо изящнее бы решил проблемы на которые я наткнулся.
Из начальных данных у меня было только текстовое описание персонажей в количестве восьми и стиль в котором необходимо их нарисовать — комиксы типа dc или marvel. Первая мысль — просто забить все описания + описание окружающей обстановки и пусть нарисует. В результате сетка не нарисовала и половины героев, поэтому логичным было отрисовать каждого в отдельности а потом разместить в более менее простом интерьере — создать коллаж.
В принципе отрисовка при генерации была вполне удовлетворительной
Хотя не везде. Вот например известная проблема с пальцами рук, на одной руке пальцы как у хомо сапиенс, а вот на другой сеточка схалявила и нарисовала аморфную ладонь. И еще на рубашке зачем то добавила артефакт — толи заплатку, толи еще что )
Первая трудность возникла на казалось бы простом запросе: нужно нарисовать чистый пустой подвал
промт: new clean empty basement, comic book style --no furniture --ar 16:9
Как видно ни грамма чистоты. Возможно английское слово clean имеет коннотацию с empty, не знаю чем еще объяснить такой маневр в виде разлитых по полу луж и кусков штукатурки и мусора на полу.
Но дальше ждали гораздо более хитровывернутые препятствия, когда появились специфические требования к одежде и позе персонажа. Вот что вытворяла сеточка когда надо было натянуть на девушку ботфорты они же «черные сапоги выше колена», надеть ей на голову обруч с кошачьими ушками и направить ее взгляд в сторону:
промт: full height, girl, looks to the side, height 156 cm, fair hair of medium length, blue eyes, dressed in a white blouse, black and white plaid skirt and black boots above the knee, comic book style, white background --ar 3:4 --v 6.0
Как видим фраза black boots above the knee была проигнорирован на 3х картинках, а на той что не была, был проигнорирован full height. Тем не менее первая картинка точно то что необходимо было по позе и повороту головы, но остальные детали потеряны
промт: ull height, girl, head turned to the side in profile, height 156 cm, fair hair of medium length, blue eyes, dressed in a white blouse, black and white plaid skirt and black boots above the knee, comic book style, white background --ar 3:4 --v 6.0 -
Один забытый символ и все пошло по ...
промт: cat ears headband --ar 3:4 --v 6.0 - Variations (Region) by
Здесь попытка заюзать функцию, когда исправляется часть уже сгенерированного ранее изображения. На слово cat ears headband гугль и яндекс реагируют адекватно, а вот миджерни на тот момент все норовила уши пришить натуральные
промт: full body shot, girl, looks to the right side, fair hair of medium length, headband with cat ears, blue eyes, white blouse, black and white plaid skirt, black thigh high boots, dc comic book style, white background --no look at the camera, no anime style --ar 1:2 --v 6.0
Попытка направить взгляд девушки вправо, но не на камеру, как видно в 2 из 4 картинок девушка смотрит в камеру
промт: full body shot, girl, height 156 centimeters, semi-profile, looks to the side, fair hair of medium length, blue eyes, white blouse, black and white plaid skirt, black boots above the knee, comic book style, white background --ar 3:4 --v 6.0
Попытка развернуть в полуоборот - как видно в цель только 1 из 4 и то со спины
промт: full body shot, girl, height 156 centimeters, 3/4 head pose, looks to the side, fair hair of medium length, blue eyes, white blouse, black and white plaid skirt, black boots above the knee, comic book style, white background --ar 3:4 --v 6.0
еще одна попытка развернуть голову в полоборота, промт найден на просторах интернета как точно приводящий к нужному результату. Неа, опять 1 из 4 и то сомнительно )
Вообщем на эту фигуру мой вырвашийся на свободу внутренний перфикционист заставил сделать более сотни генераций, пока не был обратно посажен на цепь
В итоге вот что получилось
Мой выводы: рисующая нейросеть хороший инструмент для дизайнеров, иллюстраторов, художников, но вряд ли их заменит
Забавно что картинка на главной страницы стрим площадки встроилась интересно - получился своеобразный кентавр )