Рисую пока рисуется


Покрас акрилом, обработка нейронкой (sora).
Рассуждения о том, допустимо ли использовать нейросети для создания тематического контента, на примере Warhammer 40000
Скажу сразу - этот пост написан скорее для тренировки, как тут все работает, заодно и проверки охвата по тегам, ибо это мой первый пост на этой платформе. А заодно, сделать небольшую затравку на будущее, да и узнать мнение сидящих здесь людей о теме применения нейросетей для творчества и не только.
Причина моего интереса к этой теме началась с этого поста, Эльдары: Взлет и падение величайшей империи, где помимо не самого хорошего текста, созданного нейронкой, были просто всратейшие картинки, которые минимальным образом напоминали то, что они по факту должны иллюстрировать, а именно, эльдар. Причем даже арлекинов, которых, как потом выяснилось, даже не очень сложная нейронка рисует вполне себе сносно. Разумеется, без деталей и с рядом косяков, но и не тот ужас, который был у автора. Но бомбило у меня знатно, тем более, попробовав полчаса посидеть в Шедевруме, нейросети Яндекса, мне удалось получить ряд картинок куда более удачных, чем сделал автор того поста. Например, вот такую, которую я создал минут через 15-20, как впервые в жизни попробовал поиграться с нейросеткой:
Угадывается, кто здесь? Как мне кажется, арлекин здесь вполне узнаваем, несмотря на некоторую косячность.
И я задумался - а можно ли с использованием нейросетей создать действительно хороший или хотя бы удовлетворительный контент по какой-либо узкой тематике, например, такой как Warhammer 40000? Что бы полученный результат не вызывал яростного бугурта и бомбежа самим своим появлением (ха, нашел чего выбрать, в Вахе это норма для всего)? Можно ли вписать все косяки нейросетки (и ее не очень умелого оператора) в, допустим, сюжет? И вот в моей голове сформировалась идея для нейросетевого комикса на основе вселенной Warhammer 40000.
Вскоре выяснилось, что это несколько сложнее, чем кажется. Хотя и не удивительно, я не особо хорошо умею работать не то что с нейросетями, но и вообще с программами, мой максимум - немного поменять на основе уже написанной программы параметры измерения или обработки. И то не особо оптимально и часто с косяками. Не программист я, от слова совсем. Но, относительно неплохо умею искать информацию по ключевым словам. Это немного спасало, хотя и не всегда.
Визуализация автора сего поста за работой, создано нейросетью, суть передана, точность не гарантирована.
Вторая проблема - искать идеальную нейросеть для этого дела нет ни времени, ни желания, хотя знающие в комментариях к вышеупомянутому посту приводили неплохие результаты генерации в Stable Diffusion, намного превышающие мои генерации по качеству. Но я выбрал Шедеврум от Яндекса, по нескольким причинам. Во-первых, он писец какой простой в обращении, при этом уже не столь косячен в отрисовке незаданных деталей, как Kandinsky. Но скажу сразу, я пробовал только телеграмм-бот, может, в приложении он и лучше работает, не знаю. Или в нем надо более подробно задавать все детали, что мне делать... немного лень. Или я делаю что-то не так, что самое вероятное. Во-вторых, за него не надо платить, он русскоязычен (читать по-английски могу, правда, очень специфичные тексты, писать, увы, не особо), относительно быстро работает, не надо качать. С ним нет геммора, короче.
А еще, его, как оказалось, уже писец как засрали Вахой. Да-да, Ваха в Шедевруме есть, причем он даже в целом знает, блин, даже всю четверку хаоса (но вам ее сейчас не покажу).
Держите лучше Императора, хотя, это рисовалось не через запрос про Императора. В этой форме, полагаю, не очень много изображений в сети ассоциируется с ним, потому пришлось повозиться по иному. А по запросу он рисует обычно золотого мужика.
Этот факт очень сильно упрощает работу, особенно, если хочешь работать с космодесантом. Их он знает очень хорошо, пусть и с ошибками в деталях.
Более того, он может делать и более специфичных ребят, не столь популярных, как эти двухметровые ребята в броне. Например, что неожиданно, тау, хотя скажу честно - несмотря на простой запрос, выдает он их далеко не сразу.
Типичная меха тау, в их дефолтных цветах. Но не канон, но не так важно. Под ногами, положим, гуэвеса.
Механикус с имперскими рыцарями и титанами делает довольно неплохо. Ну, оно и не удивительно, их тоже полно всяких изображений, да и ничего в них сложного нет.
С орками пришлось чуток повозиться, ибо без дополнительных уточнений рисует им человеческие носы, но с небольшой поправкой, получаются весьма каноничные ваховские орки.
Но можно гонять и на земле, орки не очень привередливы, если можно делать много разрушений громко и и ярко.
Некроны также получаются вполне узнаваемо, хотя и без деталей. Ну и того, что нейросеть часто пытается сделать их похожим... на терминатора?
Правда, что бы не рисовало голову терминатора, надо задавать их не просто как некроны, а как фаэрон. Почему-то сразу лучше рисует.
А вот с эльдарами всех мастей, кроме арлекинов, вичек и рядовых друкхарей без шлемов )без подробностей конечно) оказалось дело чуть сложнее. Их вытянутые шлема рисуются очень и очень с трудом и неохотно, часто желая сделать ненужный капюшон. Без шлемов рисует лучше. Их транспорт можно даже не пытаться рисовать, он безумно всрат, хотя почему - для меня загадка. Возможно, не так задаю.
Например, так вот. Похоже на эльдар, но кто... неясно. Допустим, кто-то из колдунов не очень следующего традициям мира-корабля.
А тут попробуйте угадать, кто это. Можете написать в комментарии, будет интересно узнать, кто угадал.
А вот тиранидам капитально не повезло, они какие-то... механические? И слишком на чужих смахивают.
Так что, исходя из полученных результатов работы с нейросеткой, я рассудил, для кое-каких фракций из Вахи очень даже можно сделать комикс, удачно ввернув вся нейросетевые косяки в сюжет. И уже начал делать, хотя, дело оказалось крайне медленным и трудным даже для нейросетки. Ну, это не удивительно, я не очень с компом, да и приходиться работать в Paint, ибо иных прог для таких изображений (специализированные не считаются) нет, а ради одного комикса качать и учится работать в других желания нет, и так много времени занимает. Так что ждите в течение ближайших недель комикс, всратый, но с любопытной идеей.
И заканчивая, вношу парочку опросов.
И как, говорится, спасибо за внимание! Комментируйте, будет интересно.
И картинка на последок.
"Прыжок в неизвестность", Midjourney и я
Тут я тихонько поговорю о том, как я создаю иллюстрации к "Прыжку в неизвестность", и сколько на это уходит времени.
И скажу тут сразу: да, я знаю про кривую анатомию, знаю про пальцы, руки и прочее. Я стараюсь делать так, чтобы в моих иллюстрациях это по крайней мере было не слишком откровенно заметно.
Я давно и с любовью пользуюсь Midjourney, при должном упорстве она выдает по-настоящему достойный результат. Другой вопрос, что это "должное упорство" у меня, порой, затягивается не на один день.
Например, портрет Здоровяка По я генерировала в несколько подходов, пробуя те или иные запросы, просто бесконечно повторяя генерации одних и тех же запросов с подкручиваением настроек.
"Здоровяк По — личность примечательная. Плотный, невысокий, круглолицый. Глаза темные миндалевидные, волосы черные, вечно растрепанные. Отличительный признак — ожирение второй степени." Прыжок в неизвестность. Часть 5.
Финальная версия выглядит так:
warhammer 40000 art, a fat man in dirty work overalls sits on a metal chair and laughs madly, one of his hands turns into a tentacle, interrogation, gloomy interrogation room --ar 3:2 --v 6
Как видите, черных волос мне добиться так и не удалось, ибо мидж считает, что раз человек толстый, он обязательно лысый. В конце концов, я сдалась.
Был и альтернативный вариант этой сцены:
warhammer 40000 art, Acolytes of the Inquisition, a man and a woman in black, in front of them sits on a metal chair a fat bald defendant, dressed in an orange dirty work suit, interrogation, interrogation room, gloomy interrogation room --ar 3:2 --v 6
Здесь я долго пыталась добиться того, чтобы аколиты выглядели не как два рандомных блюстителя, а похожими на себя.
Мне понадобился час времени, чтобы здаться и перейти к варианту выше.
Поедем к следующей моей любимой иллюстрации: портрет инквизитора Фридриха Грюнвальда.
"Его Светлость Фридрих Грюнвальд был человеком великими как в прямом так и в переносном смысле. Широкоплечий здоровяк два метра ростом, он казался еще выше и шире за счет ярко-красной силовой брони, украшенной золотыми черепами Ордо. По традиции своей родины, он носил длинные уже седые дреды и ухоженную, заплетенную в две косы бороду. Одному Императору известно, сколько лет Грюнвальд бороздил просторы сегментума Солар, но, несмотря на седину и прочертившие лоб глубокие морщины, стариком назвать его язык не поворачивался. Бодро вышагивая в окружении штурмовиков, над которыми возвышался на добрых полторы головы, он наводил ужас даже на своих собственных аконитов. В основном тем, что широко и добродушно улыбался." Прыжок в неизвестность. Часть 11
warhammer40k, A tall man with a long gray beard braided into a braid and long gray dreadlocks, in bright red power armor and holding a thunder hammer --v 6.1
Здесь уже работалось легче: подъехала версия 6.1, она умнее свой предшественницы и гораздо лучше работает с тем, что указано в тексте (зато совершенно безобразно с картинками), меньше додумывает и реагирует на изменения текста при повторной генерации.
Единственное, что мне так и не удалось победить: заплести бороду в косички... И дать молот ему в руки...
Лучшее, что удалось получить:
Едем дальше :З
Первая встреча Рейвен и Вергилия/Льюиса
"— Значит подлиннее, — вздохнул он и указал на сервочереп. — Я — дух машины, который живет в этом прекрасном сосуде. Вернее, экспериментальная версия духа машины, которая была создана на основе сильно поврежденного, но еще не угасшего сознания человека. Поначалу я идентифицировал себя как Вергилий — выудил это имя из остатков воспоминаний. А, когда ты меня подключила к себе, проскользнуть мимо защиты труда не составило, и я получил доступ к довольно занимательным данным. Сверившись с тем, что у меня уже было, я осознал: ты знала того, кому принадлежало сознание моего восхитительного хранилища. И твои воспоминания дополнили кое-какие пробелы, чтобы я смог в полной мере воссоздать того… Хотя нет, почему “того”? Воссоздать свой образ. Я — Вергилий. Это моя машинная составляющая. И я — Льюис Эберхарт. Это моя человеческая составляющая." Прыжок в неизвестность.Часть 12
warhammer40k art, In the room stands a tall, blond man of forty years old in a black officer's uniform, next to him floats a servoskull with one red eye and many wires --ar 3:2 --v 6.1
Ууу, тут пришлось помучаться, ибо нейронка все время выдавала что-то вроде:
warhammer40k art, In the room stands a tall, blond man of forty years old in a black officer's uniform, next to him floats a servoskull with one red eye and many wires ---ar 3:2 --v 6.1
То есть, если человек получался хорошо, то вот с сервочерепом пришлось повозиться.
На всё-провсе где-то 120 попыток практически одного и того же запроса с выбором определенных понравившихся вариантов и прицельным перегенерированием сервочерепа.
Следующая довольно тяжелая для генерации иллюстрация:
Рейвен просыпается в плену у хладных торговцев
warhammer40k art, a woman of about thirty with short black hair in a torn officer's uniform sits tied to a chair in an abandoned hangar, anger and contempt in her eyes, numerous abrasions on her body --ar 3:2--v 6.1
Её я получила подхода, наверное, с четвертого. Мне нужна была максимально несексуализированная и уставшая женщина, попавшая в плен. Идеально, если бы у неё еще упрямая ярость была была в глазах.
Но мидж упорно подсовывал мне что-то типа:
warhammer40k art, A stern woman of about forty with black hair to her shoulders, she is tied to a metal chair, her hands behind her back, many bruises and abrasions are visible on her body, there is anger in her eyes --ar 3:2 --v 6.1
О ярости в глазах я даже просить боялась, грудь бы спрятать.
В общем, у меня, наверное, генерация 500 в общем счете вышло перед тем, как я получила более-менее подходящий результат.
И последняя довольно спойлерная иллюстрация к грядущей главе.
warhammer 40k art, A stern woman of about thirty-five with black shoulder-length hair in a black officer's uniform and a tall, thin man in a black cloak stand in a hangar against the backdrop of a space shuttle --ar 3:2 --v 6.1
Тут долго плясать с бубном не пришлось, практически сразу получила именно то, что мне было нужно :З
Но она мне прям безумно нравится :З
Напоследок покажу вам портреты главных героев "Прыжка в неизвестность", которые получились довольно близко к тому, как я себе их представляю
Рейвен Дальмайер (и на заднем плане Картезио Дандоло, у так получилось :D)
И Филипп фон Хардинг (вообще, изначально волосы у него должны были быть длиннее, но потом я поняла, что это будет ну очень уж откровенная отсылка на Хенрикса ван Калокса. Дознаватель, псайкер, биомант... Ну, вы поняли)
























































































