Дневной сон
Читала от рассвета до заката
Пишем книжки по картинке
C помощью CLIP Interrogator и Llama2 на HuggingFace можно написать историю по картинке.
А что, очень удобно) Генерим картинку в Midjourney или в бесплатных Leonardo,
Stable Diffusion XL , загружаем в сервис и получаем готовую книгу, легкий заработок 🤌
Хотите узнавать первыми о полезных сервисах с искусственным интеллектомдля работы, учебы и облегчения жизни? Подпишитесь на мой тг (ссылка в описании) там я рассказываю, как использовать нейросети для бизнеса 😉
Илай Шортман
Любой человек, занимающийся творчеством знает, насколько важно вдохновение. Насколько оно неуловимо. И что иногда оно приходит, откуда не ждали)))
Завсегдатаи паблика "Стоящие на тёмной стороне" знают, какую симпатию я питаю к фильмам про Джона Уика.
Потрясающая история беларуса Джардани Йовановича, так же известного как Баба Яга, прекрасна в своей простой наивной крутизне.
Уже очень давно у меня крутилась идея создания пародии на этот фильм. Так же, идея комедийного боевика про команду героев, списанных с меня самого и моих ближайших друзей.
И вот, в преддверие дня рождения моего лучшего друга все идеи сошлись воедино. Я решил таки написать пародию на фильм в виде небольшой повести. Как говорится, книга - лучший подарок. А как насчёт книги, написанной про виновника торжества?)
Так Илья стал Илаем Шортманом, бывшим киллером, ушедшим в сферу IT. Но только он думал, что завязал, как его опять туда затащили!!!
Илай вновь сталкивается с кланами ассасинов, и выходит на тропу войны со своим бывшим напарником Оливьеро Де Шишковио.
Просто написать текст и скинуть документ было бы скучно, не правда ли? Хотя рассматривался и вариант с открыткой в виде секретного письма, содержащего в себе QR-код для скачивания книги)
Я стал искать варианты физического и графического воплощения своей идеи параллельно работая над историей. Все иллюстрации я создавал с помощью нейросети Stable Diffusion, используя фото друзей как прототип изображения персонажей. Так простые парни из маленького города стали ассасином, мафиози, мечником, бандитом, супер-агентом и судьей. Нейросеть выдавала множество вариантов. В том числе и весьма странных) Альтернативные версии персонажей попали в специальный раздел Backstage в конце книги.
Три недели напряженной работы над книгой (почти всё свободное время после работы и в выходные), и вот, за пару часов до вручения имениннику, книга была напечатана и сброшюрована. На экране компьютера 121 страница - это всего лишь цифры. Готовая книга смотрится довольно солидно, даже без типографского переплёта.
Презентация в формате вечеринки-сюрприза прошла на ура! Прототипы персонажей оставили автограф на иллюстрациях со своими героями!
"Илай Шортман" это безумная пародийная комедия, где высмеиваются все штампы голливудских боевиков. А еще, это история про настоящую мужскую дружбу)
Я выложу книгу на Пикабу и в паблик по главам. А потом, полную версию для любителей прочтения запоем)
Подписывайтесь на паблик "Стоящие на тёмной стороне" в ВК и на телеграм-канал! Следите за тэгом #ИлайШортман
Ведь это только самое начало)
Делаем обложки книг и иллюстрации. Сравнение Stockimg, SD XL и Midjourney
В этом посте я сравню платные Stockimg , Midjourney и бесплатный Stable Diffusion XL для создания иллюстраций и обложек книг
Дизайн обложек книг и иллюстрация книг востребованная услуга, с которой легко справится нейросеть. Я решила протестировать популярный сервис Stockimg для генерации обложек книг и иллюстраций.
В бесплатном тарифе доступно:
1 кредит = 1 генерация изображения
Не требуется кредитная карта
Поддержка GPU/быстрая генерация
Создание стоковых фотографий, обложек книг, обоев и других дизайнерских решений
Поэтому я создала несколько акаунтов, зная эту хитрость
Для чистоты эксперимента я использовала бесплатный STABLE DIFFUSION XL и платный Midjourney
Промпты, которые я использовала:
Snow White colored character, the character of the book of fairy tales, the book of fairy tales, the colored page of the book of fairy tales, image and text, in Disney style, linear image, sketch, anatomical, proportional, detailed
Design a cover that incorporates elements of the story's setting such as a golf course, golf clubs or clubhouse (3)
Вывод:
Не понимаю популярности сервиса Stockimg за 19$/мес, если STABLE DIFFUSION XL делает не хуже, а Midjourney за 10$/мес лучше
Хотите быть в курсе о полезных ии сервисах для работы, учебы и облегчения жизни? Подпишитесь на мой канал в Telegram НейроProfit, там я рассказываю о том, как зарабатывать с помощью нейросетей и использовать ии-сервисы для бизнеса, но, что самое главное, я тестирую сервисы перед их рекомендацией
Персонажи книги с помощью Stable DIffusion
Сложно было решить, кого генерировать следующим. По сути, второстепенных персонажей, таких, от которых ведётся какое-никакое повествование в книге, двое: Большой Босс и Инес. Оба мне нравятся примерно одинаково (как персонажи, а не как люди, там вообще фу, гадость), поэтому выбор оказался сложным. В итоге я решил, что Инес хочу оставить на сладкое.
В общем, встречайте – Большой Босс, он же Фэббиан Соти (в молодости):
Действие книги происходит в городе Нью-Солст, но Фэббиан родился и вырос не здесь. Большой Босс родом из пустынного Айка, города-государства на юге. Большинство жителей Айка с детства посвящают время медитациям и другим практикам духовного развития. Вследствие этого разум Большого Босса организован и упорядочен, в нём нет места посторонним мыслям. В связке с цинизмом, социопатией и хладнокровием это создало одного из самых опасных людей во всей книге.
StableDiffusion в очередной раз удивила меня. В процессе генерации Босса в какой-то из итераций по бокам от него возникли два человека:
Получилось это из-за того, что я генерировал не в разрешении 512х512, а в более высоком. При работе с такими разрешениями нейросетка иногда может дублировать людей, лица, тела. Когда я генерировал Джил, я об этом не знал. И теперь мне стали понятны те выкрутасы с лицами, которые там возникали.
Люди по краям – два ближайших помощника Фэббиана, его правая и левая рука. Правая – Моннки, и он удивительно точно попал в мою интерпретацию его образа. Конечно, пришлось немного доработать внешность, но совсем чуть-чуть. Моннки имеет практически идентичные имплантации, и основная его задача – охрана Босса. Человек слева – Коллтер. В книге он упоминается лишь один раз, в качестве голоса по телефону. Его я себе представлял плохо, но постарался сделать его менее похожим на Фэббиана.
Единственная проблема, что Коллтер и Моннки сгенерировались слишком близко к краям. Пришлось увеличить разрешение и догенерировать недостающие элементы.
Начальное изображение после увеличения разрешения:
Процесс того, как происходила обработка:
Финальный результат:
Ну, почти финальный. Каждого персонажа я ставлю себе на рабочий стол в качестве обоев. Поэтому я повысил разрешение и детализацию.
Получилось вот что:
Мне нравится, как устрашающе они выглядят. Кстати, светящиеся красным глаза – это не придумка ради красивости арта. Босс – человек себе на уме, и он поставил себе глазные импланты, которые угрожающе светятся по его желанию. Думаю, вкупе с репутацией самого опасного преступника глаза оказывают на собеседников потрясающий эффект.
В прошлом посте я писал, что нейросеть любит генерировать лица. Просто зацените, как SD их любит (внимание в правый нижний угол, на воротник рубашки Моннки):
Изображений Босса получилось не так много. Очень долго я пытался попасть в образ. Но. В качестве небольшого бонуса. Я случайно выставил довольно высокий параметр изменения картинки, и случайно нажал кнопку «Сгенерировать».
То же изображение, но будто из параллельной реальности. Реальности какого-нибудь городского фэнтези/детектива. Демон с двумя миньонами. Чёрт, я даже жалею, что Босс, Моннки и Коллтер выглядят совсем не так.
Персонажи книги с помощью нейросети
Финальный результат для привлечения внимания, пока без пояснений:
Продолжаю мучить StableDiffusion от Automatic1111. В этот раз я попытался сгенерировать… ну как попытался, чего прибедняться – сгенерировал Джил. Третья из главных героев моей книги, студентка двадцати двух лет.
С Джил всё немного интереснее в плане референсов в реальности. Их нет. Кросс и Мэйтт имеют свои прототипы, на основе которых и базируется их внешность. Для Джил реального образа или человека не существует. Тем не менее, после нескольких часов генерации я нашёл почти идеальное попадание в мою интерпретацию образа.
Знакомьтесь, Джил Форт:
Самые прозорливые могут обратить внимание, что изображения выглядят несколько неестественно. Слишком гладкая, кукольная кожа. По сути, в этих изображениях я доволен двумя вещами – взгляд и схожесть с образом в моей голове. Но нейросеть творит чудеса преображения. Ща покажу.
На генерации Мэйтта я уже научился расширять изображение, заставляя SD дорисовывать недостающие элементы фона на пустых местах. Сказано – сделано. Вот что получилось:
Всё ещё неестественно, кукольность никуда не делась, даже несмотря на то, что я немного обработал кожу. Да и фон какой-то… ну, никакой. В общем, мне не хватило идеи. Что с этим делать, я придумал не сразу, а поэтому решил попробовать воспроизвести сцену из конца книги, с другим сгенерированным изображением.
Вот это нечто справа от Джил – вышло совершенно случайно. Я рандомно генерировал ту область, прокручивая варианты, и на одном из них появилась эта «голограмма». Более того, у «голограммы» было женское лицо. Его пришлось убрать, слишком чётким оно получилось, но вот остальное – просто находка.
Дальше вот эти молнии на лице. Будто дикая энергия бурлит в Джил, прорывая кожу светящимися трещинами. Это уже не случайность, но добиться этого стоило стольких нервов и усилий… Сначала простым перебором (да и ещё таким, который минимально меняет картинку, чтобы не потерять схожесть образа). Потом я нашёл в SD замечательный инструмент Sketch. Там можно схематично изобразить, что нужно, и нейросеть дорисует по этой схеме + промпт. Спасибо жене, я ж вообще не умею рисовать, а она умеет. Помогла нарисовать молнии.
После добавления молний захотелось больше хаоса. С учётом того, что происходит по сюжету. В дело пошёл Inpaint. Я закрашивал отдельные области, говорил «генерируй изображения только в них» и писал в промптах нечто вроде: «искры, размытие, сияние, гало, аура», комбинируя их так и сяк. По итогу получилось вот это:
Кстати, для шлифовки этих артов пришлось пройти ускоренные курсы фотошопа. Дело в том, что в некоторых изображениях сгенерировались детали, которые хотелось бы видеть в основном арте (молнии и некоторые искорки). Пришлось вырезать их, перенести. Пришло понимание, что в связке с фотошопом возможности поистине безграничны.
Но это ещё не всё. Вернёмся к предыдущему изображению. Мне понравились попытки в концептуальность. Не просто делать портрет персонажа, а вкладывать идею в арт. Пусть даже иногда идея вкладывается нейросетью посредством случайности. Кто я такой, чтобы спорить?
Я начал менять фон с высоким параметром Denoising strength, который позволяет сильно изменять картинку. И в какой-то из многих генераций выскочило вот это:
В общем, рандом сам подкинул идею, резонирующую с идеей Джил, как персонажа. В чём смысл – по книге, Джил слышит голоса. Не спойлер, прям в аннотации так написано. Только захотелось сделать это не таким… реальным. Начинаем генерировать левую часть, превращая её в эфемерность, воображение, метафизику, аниме.
В процессе StableDiffusion ещё несколько раз удивил меня рандомом. Дело в том, что нейросетка очень любит женские лица. И при высоком разрешении и высоком параметре изменения картинки подсовывает эти лица при любом удобном случае, стоит только зазеваться. Пример:
В данном случае, это только на руку. Итак. После нескольких часов получилось вот что:
Сверху – подруга Джил, Элиза. Хотя тут у нас с женой возникли разногласия. Она сказала, что Элиза в самом низу. Что ж, не могу никому указывать, только напомню, ЧТО Я ТУТ АВТОР, МОЁ СЛОВО – КАНОН!
Итог. Я не устану повторять, что я в восторге. Чем глубже я погружаюсь в нейросеть, чем больше изучаю её возможности, тем больше приходит понимание, что можно делать с её помощью.