9

Персонажи книги с помощью нейросети

Прошлый эксперимент с генерацией персонажей превзошёл мои ожидания. Я даже не думал, что внешность получится настолько похожа на ту, что существовала лишь в голове. Я не художник, поэтому для меня воплощение мыслеобраза в образ визуальный сродни чуду. Посему продолжаю мучать нейросеть.

Следующий – Мэйтт Уолли.

Интересный факт – именно с истории этого персонажа, его семейной трагедии, началась книга. Я писал об этом в послесловии, но напишу ещё раз.

*играет мрачный блюз*

В далёком 2015 году мне приснился сон. В этом сне мальчик – Дарри – получает на свой десятый день рождения щенка, о котором так давно мечтал. Он рад до слёз такому подарку.

*смена кадра*

Вечер. Они играют на лужайке перед домом – Дарри кидает резиновый мячик, тот летит в кусты и щенок, весело тявкая и путаясь в лапах, несётся следом. Родители смеются, наблюдая за локальным счастьем.

В этот момент рядом с мальчиком возникает тёмная фигура в мантии и капюшоне. Родители видят, как не совсем человеческий силуэт склоняется над их сыном, но ничего не предпринимают, ибо знают – всё бесполезно. Довольный щенок находит, наконец, мяч, несётся к своему молодому хозяину, и не обнаруживает его. Родители плачут, щенок испускает долгий, протяжный вой, мать и отец, обнявшись, рыдают… конец сна.

*блюзовая музыка останавливается*

Знакомьтесь – отец мальчика, Мэйтт Уолли. Вот и он:

Внешность Мэйтта я видел так же хорошо, как и внешность Кросса. И у Мэйтта тоже существует прототип. Этим прототипом был Альберт Эйнштейн стал персонаж сериала «Герои», Мэтт Паркман.

*голос из соседней комнаты*

– Ты даже имя спёр!

Неправда. Во-первых, я изменил его. Во-вторых, я стащил не только имя. Загибайте пальцы – Мэтт Паркман, как и Мэйтт Уолли, работает в полиции. Эм… всего один палец… ну ладно. На самом деле те, кто смотрел «Героев» и прочитал «Сэхсвет» (а такие есть, как оказалось, что очень приятно), без сомнения, найдут ещё одну общую черту, очень важную. Скажете – плагиат! Отвечу – творческая переработка. Но на этом, хвала Старикам, сходства заканчиваются. Сама история и жизненный путь у Мэйтта Уолли сильно отличается от его прототипа.

Мэйтт – хороший законник, детектив. К сожалению, после сокрушительного удара судьбы, разрушившего сам смысл его существования (больше пафоса!!!), он несколько теряется в жизни, и принимает ряд спорных решений. Которые, как это часто бывает, только усугубляют ситуацию.

Ещё один вариант. Если на первом арте изображён Мэйтт до начала событий книги, то тут, как мне представляется, он уже принял те самые спорные решения о том, что делать дальше:

А тут уже прошёл через  некоторое дерьмо. Как будто куда-то бежит, волосы растрепались, поменялся взгляд, стал более диким:

А вот то, от чего у меня, пока только начинающего изучать StableDiffusion, просто сорвало башню. Ниже те же самые изображения Мэйтта, дорисованные и обработанные силами сборки Automatic1111. Я повысил разрешение, и нейросетка сама дорисовала то, что должно быть в пустом пространстве (согласно новому промпту):

Первый эксперимент - просто добавил фон и детализировал картинку.

Тоже самое, фон + детализация.

Мэйтт на полюсе. Или в серверных. Очень озадачен тем, что там обнаружил.

Мэйтт находит того, кого ищет. В баре, где же ещё.

И это всего после нескольких дней изучения сборки, её расширений и возможностей. Думаю, что перейду на Automatic1111 как на основную, но и Easy Diffusion забрасывать не буду, она генерирует изображения быстрее, и там есть удобная кнопка Make similar, которая генерирует 5 похожих изображений на основе любого из полученных. Цикл можно повторять до бесконечности, подбирая подходящие варианты. В общем, попробую миксовать сборки, посмотрю, что из этого получится.

Технические подробности:

Prompt:

very short brown hair, Matt Parkman from Heroes, 1man, dark and gloomy full body 8k unity render, male adult 35 years old, brown short hair, wearing jeans and a jacket, at cluttered and messy shack, cyberpunk, action shot, porcelain cracked skin, skin pores, detailed intricate iris, very dark lighting, heavy shadows, detailed, detailed face, (vibrant, photo realistic, realistic, dramatic, dark, sharp focus, 8k)

Negative prompt:

anime, ugly, low quality, bad artistnude, black and white, close up, cartoon, 3d,
denim, (disfigured), (deformed), (poorly drawn), (extra limbs), blurry, boring, sketch, lackluster, signature, letters, watermark, low res, horrific, mutated, artifact, bad art , gross , b&w , poor quality, low quality, cropped

Вещь, которую я понял – промпт, конечно, очень важен, если вы хотите сгенерировать красивый арт. Но не менее (а то и более) важно потом обработать изображение, допилить до ума отдельные элементы и детали, что зачастую намного проще, чем добиться этого одним лишь промптом. Кстати, что позитивный, что негативный промпты в моём примере – совершенно избыточны, и то, что я сгенерировал – больше результат рандома, чем грамотного ТЗ. В общем, ещё учиться и учиться.

Сборки StableDiffusion:

EasyDiffusion и Automatic1111

Модели – rpg_V4, deliberate v2.

На EasyDiffusion и модели rpg_v4 были сгенерированы первые изображения. Но потом я погрузился в тему чуть глубже, и поставил сборку Automatic1111. Она сложнее во всём: установка, управление, и прочее, прочее. Но и результаты даёт более крутые.

Резюмируя:

1. Я доволен, как слон.

2. Кросс точнее попал в книжный образ. Тем не менее, Мэйтт очень хорош.

Скоро нейросети захватят мир, и уже мы будем служить им в качестве кошкожена

3. Нейросети - чудо, самые замечательные и прекрасные, лучшие в мире.

пожалуйста, пощадите меня в будущем

4. Для тех, кому захочется почитать книгу – сделать это можно на АвторТудей, бесплатно.

Повторю мысль из прошлого поста – это не гайд по использованию SD. Скорее, это восторженный вопль автора, воочию увидевшего своих персонажей. Возможно, какие-то нюансы работы с нейросеткой я упустил, так что открыт к критике и новым знаниям.

Если возникнут какие-то вопросы – задавайте, постараюсь развёрнуто ответить в комментах.

Книжная лига

28.2K пост82.1K подписчиков

Правила сообщества

Мы не тоталитаристы, здесь всегда рады новым людям и обсуждениям, где соблюдаются нормы приличия и взаимоуважения.


ВАЖНЫЕ ПРАВИЛА

При создании поста обязательно ставьте следующие теги:


«Ищу книгу» — если хотите найти информацию об интересующей вас книге. Если вы нашли желаемую книгу, пропишите в названии поста [Найдено], а в самом посте укажите ссылку на комментарий с ответом или укажите название книги. Это будет полезно и интересно тем, кого также заинтересовала книга;


«Посоветуйте книгу» — пикабушники с удовольствием порекомендуют вам отличные произведения известных и не очень писателей;


«Самиздат» — на ваш страх и риск можете выложить свою книгу или рассказ, но не пробы пера, а законченные произведения. Для конкретной критики советуем лучше публиковаться в тематическом сообществе «Авторские истории».


Частое несоблюдение правил может в завлечь вас в игнор-лист сообщества, будьте осторожны.


ВНИМАНИЕ. Раздача и публикация ссылок на скачивание книг запрещены по требованию Роскомнадзора.

1
Автор поста оценил этот комментарий
Посмотрела прошлый пост, без описания, первый кто пришел в голову, глядя на картинку - Мэтт Беллами) классно получилось
раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Благодарю)

Старался сделать его не прям копией Беллами, а просто узнаваемые черты оставить. Удивлен, насколько гибкие возможности для этого в нейросетках присутствуют)

0
Автор поста оценил этот комментарий
Да, что-то юникс-подобное. Вы правы, этот гайд и возможно сборка не проканают и нужно сочинять заново.
Это имело бы смысл если бы результат можно было бы использовать для работы. Но пока он для "чиста паржать", оно того просто не стоит.
Мерсибо ку за помощь.
раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Ну, я знаю, что с помощью этого уже зарабатывают :) Кто-то обложки для книг пилит, кто-то 2д модельки для игр (типа оружия, брони, предметов, и т. д.) и продает их. Уже можно придумать, как для работы использовать.

Всегда пожалуйста, успехов вам :)

0
Автор поста оценил этот комментарий

ссылки-то работают...


первый хочет поставится только по специфичному линуксовому пути, и что существуют другие юникс-подобные оси оси ему невдомек


второй потерял системные файлы _C.cpython-310-darwin.so, libomp.dylib, libtorch_cpu.dylib, а это уже совсем гиблое дело


видимо пацаны чисто под свое окружение зафигачили

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Если я правильно понял, и у вас линукс или что-то ему подобное, то да, конкретно те ссылки, что я дал, заточены под винду, вроде как. На всякие макОс, линуксы и прочее нужно искать отдельные гайды (и возможно, сборки). Я в этом не разбираюсь, к сожалению, я пытаюсь ковыряться непосредственно с интерфейсом нейросетки :)

Если же я понял не правильно, и у вас винда, то все равно странно, так как я именно по этим ссылкам все делал, скачивал. Поставилось с первого раза, без проблем, все нужные файлы докчались сами. Возможно, авторы что-то меняли, и не указали это в гайдах своих. Тут уж тогда самому гуглить про то, как поставить сборку, либо Automatic1111, либо EasyDiffusion.

показать ответы
0
Автор поста оценил этот комментарий

месибо ку!
в первом варианте ошибка, ща этот попробую

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Странно. У меня все ссылки работают.

показать ответы
0
Автор поста оценил этот комментарий

Ух. Тут в пару слов не обойтись)

Короче, если просто и коротко - нужно установить сборку Stable Diffusion Automatic1111. Как это сделать - на ютубе/в гугле полно гайдов. После установки идешь на сайт с моделями, и скачиваешь вот эту:

https://civitai.com/models/4823/deliberate

Она больше для генерации людей, как я понял, но очень хороша и для всего остального. Потом, если будет желание, можно скачать другую, под специфические задачи.

И потом можно взять стили, которые ты добавляешь к основному промпту. Можно взять отсюда, бесплатно:

https://dtf.ru/s/595875-neyro-iskusstvo/1705041-fayl-style-c...

Я пользуюсь другими, но супер кардинальной разницы не будет. Как их поставить, тоже гайды есть. Можно и без стилей, результаты и так хорошие будут. Тем более, что стиль - это просто кусок промпта. Ты можешь посмотреть (файл со стилем можно открыть в экселе и посмотреть, что там запросе), и сам вставлять куски или целиком.

Есть вариант попроще:

https://www.ixbt.com/live/sw/ustanovka-neyronnoy-seti-na-pk-...

Другая сборка StableDiffusion, не такая гибкая, но для новичка и генерации не очень замысловатых артов сойдет. Но если планируешь вкатываться в нейросети серьезно, то лучше первый вариант + модель Deliberate по первой ссылке. Как ее установить, тоже куча гайдов есть, например:

https://vk.cc/cnPnFJ

Ну а когда сборка установлена, нужно гуглить, как правильно составлять промпты, что даёт то или иное слово. Но опять же, для простых запросов особо ничего не нужно.

Советую попробовать второй вариант сначала (я именно с него начал), там вообще ничего сложного. Если понравится, и если позволяет железо, то можно думать дальше, чего, собственно, от нейросетки нужно. А даже если железо не позволяет, есть облачный вариант, гуглить по словосочетанию google colab stable diffusion. Таким способом можно через облачные сервис все делать, тоже бесплатно. Но тут не подскажу, я этим не занимался.

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Вот, кстати, получше гайд для установки Automatic1111:

http://www.newart.ru/htm/myzavr/mz196.php

Там вообще много полезной инфы, недавно ссылкой поделились)

показать ответы
1
Автор поста оценил этот комментарий

Гораздо лучше! Научи?

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Ух. Тут в пару слов не обойтись)

Короче, если просто и коротко - нужно установить сборку Stable Diffusion Automatic1111. Как это сделать - на ютубе/в гугле полно гайдов. После установки идешь на сайт с моделями, и скачиваешь вот эту:

https://civitai.com/models/4823/deliberate

Она больше для генерации людей, как я понял, но очень хороша и для всего остального. Потом, если будет желание, можно скачать другую, под специфические задачи.

И потом можно взять стили, которые ты добавляешь к основному промпту. Можно взять отсюда, бесплатно:

https://dtf.ru/s/595875-neyro-iskusstvo/1705041-fayl-style-c...

Я пользуюсь другими, но супер кардинальной разницы не будет. Как их поставить, тоже гайды есть. Можно и без стилей, результаты и так хорошие будут. Тем более, что стиль - это просто кусок промпта. Ты можешь посмотреть (файл со стилем можно открыть в экселе и посмотреть, что там запросе), и сам вставлять куски или целиком.

Есть вариант попроще:

https://www.ixbt.com/live/sw/ustanovka-neyronnoy-seti-na-pk-...

Другая сборка StableDiffusion, не такая гибкая, но для новичка и генерации не очень замысловатых артов сойдет. Но если планируешь вкатываться в нейросети серьезно, то лучше первый вариант + модель Deliberate по первой ссылке. Как ее установить, тоже куча гайдов есть, например:

https://vk.cc/cnPnFJ

Ну а когда сборка установлена, нужно гуглить, как правильно составлять промпты, что даёт то или иное слово. Но опять же, для простых запросов особо ничего не нужно.

Советую попробовать второй вариант сначала (я именно с него начал), там вообще ничего сложного. Если понравится, и если позволяет железо, то можно думать дальше, чего, собственно, от нейросетки нужно. А даже если железо не позволяет, есть облачный вариант, гуглить по словосочетанию google colab stable diffusion. Таким способом можно через облачные сервис все делать, тоже бесплатно. Но тут не подскажу, я этим не занимался.

показать ответы
2
Автор поста оценил этот комментарий
Сколько ни пытался сгенерить мотоциклы в разных ракурсах - вечно получается какая-то карикатурная хуйня :(
раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Ну вот, например. С моими настройками Stable Diffusion по запросу

a motorbike, Harley-Davidson, cinematic, artstation

Это за пару минут, особо не перебирал варианты.

Иллюстрация к комментарию
Иллюстрация к комментарию
показать ответы
2
Автор поста оценил этот комментарий
Сколько ни пытался сгенерить мотоциклы в разных ракурсах - вечно получается какая-то карикатурная хуйня :(
раскрыть ветку (1)
0
Автор поста оценил этот комментарий

А какой промпт и модель использовали?

показать ответы