Наверное, не существует современного писателя, который не успел еще побаловаться с нейросетями в попытках проиллюстрировать свои тексты. Я не исключение, и сегодня хочу поделиться самыми смешными и нелепыми генерациями Midjourney, которые у меня невольно получались. (Многорукость и многопалость не в счет).
Островная псина
Текст
"Небольшая тупомордая голова сидела на мускулистой шее покато переходящей в тело. Рыжий, почти красный жесткий мех на хребте становился черными или белыми иглами, между которыми спускались полосы такого же цвета. В короткой пасти прятались желтые страшные зубы, а челюсти были настолько мощными, что без особых хлопот могли бы перегрызть бедро лосю".
В общем, если вам нужно что-то угрожающее и мощное, но обязательно собакоподобное, слово "dog" под запретом. Scary, grinning, looks aggressive, monstrous, как видите, не помогает.
Медведь и волк тоже не подошли: они легко считывались и фантастического зверя не выходило. Пришлось брать за основу гиену. Так, я узнала, что думать, будто бы Midjourney знает, что pachycrocuta - это пещерная гиена, крайне опрометчиво.
Что же, б*ть, по мнению нейросети pachycrocuta такое?
Молодой человек
Удачная генерация
Довольно долго пыталась попасть в нужный возраст с "seventeen - year - old", "teenager" и "young man", но в этом мало смешного. А с тоном кожи получилось прекрасно. Писала "смуглый" (swarthy) - получала чернокожих. Попробовала зайти с другой стороны и написала латинос - получилось это
О.О почему, Midjourney, почему?
Хотела сделать картинку динамичной и сгенерировать, как этот молодой человек заклинает огонь (фэнтези, как-никак). Точнее создает огненную птицу. Огненная птица - мой личный фаворит среди дебильных генераций.
Таверна
Устав от серьезного составления запросов, в какой-то момент шутки ради ввела первые строчки романа. "Войдя в душное помещение, мужчина застыл в ужасе. Таверна не просто не пришлась торговцу по вкусу — она потрясла его до глубины души своей мерзостью". (Entering the stuffy room, the man froze in horror. The tavern not only did not suit the merchant to taste - it shocked him to the core with its abomination). Три из 4-х вариантов, предложенных midjourney, были не подходящими, плохо прорисованными, но логичными: стремный мужик на пороге стремного места. А 4-ый вот.
И в заключение - хохма для узкой аудитории
Что я хочу получить, когда пишу "глаза змеи" (snake eyes)
Что я получаю
Иллюстрации генерировались для романа "Хуадад-Сьюрэс".
Триста обложек? Зачем столько? Всё просто: осенью 2022 года мы — команда людей, никогда не имевших отношения к издательскому делу, — создали проект «Прочитано». Это бесплатная онлайн-библиотека коротких рассказов современных русскоязычных авторов на 2—10 минут чтения: рассказов, в которые можно погрузиться за чашкой кофе. Все мы помним с детства, что текст с картинками читается легче, поэтому создание иллюстрации-обложки к каждому из трёхста стартовых рассказов (а мы решили, что именно столько будет достаточно для запуска сайта) было обязательной частью визуала.
Февраль 2023: стартовые рассказы отредактированы, откорректированы, готовы к публикации. Ну, почти готовы: не хватает обложек. Запуск проекта — март 2023.
Задача: отрисовать триста нестыдных картинок за месяц. Смешно? На тот момент нам было не очень.
Варианты:
Нанимать иллюстраторов. «Нереально», — сразу отмели мы. Дорого, долго, каждый рассказ — уникальный, со своей атмосферой и стилистикой. Кроме того, мы с самого начала определились, что после запуска библиотека будет пополняться новыми рассказами каждый день — просто физически невозможно будет поддерживать темпы публикаций.
Искать другие решения.
А других решений оказалось не так-то и много: не справится интеллект естественный — пойдём к искусственному. По сути, нужно было решить для себя этическое «да/нет ИИ» и выбрать наиболее удобную из активно развивавшихся в тот момент нейросетей.
Попробовали Stable Diffusion, попробовали Midjourney — и остановились на второй. Тогда она показалась нам более удобной и понятной (спойлер: мы ни о чём не пожалели).
От теории к практике
Итак, для себя мы решили, что каждая иллюстрация должна:
— быть красивой;
— быть оригинальной;
— отражать дух текста;
— не обманывать читателя;
— передавать задумку автора рассказа.
Иллюстрация к рассказу «Грамотным быть — модно!»
Как это сделать?
В нашем случае обозначилось два пути, выбор которых зависел от того, были ли у автора пожелания по обложке или нет (при заключении договора мы предлагаем писателям рассказать нам о своём видении).
Если пожелания были, нам оставалось перевести их на язык, понятный нейросети (об этом чуть позже).
Если нет, опытным путём мы выработали алгоритм, которому следуем до сих пор:
Читаем рассказ.
2. Решаем, какой атмосферой, духом должна обладать иллюстрация, чтобы читатель, взглянув на неё, сразу понял, с каким настроением будет рассказ — или, наоборот, мог по обложке подобрать рассказ под своё настроение. Так, комедии часто подходят карикатуры, лиричному тексту — импрессионисты; рассказ о первобытных людях получает обложку в виде наскальной живописи, а тёплая деревенская история подсказывает обратиться к гжели.
4. Формулируем запрос. В практике нейросетей он называется «промт» (prompt) и содержит ключевые слова, по которым ИИ понимает, что мы от него хотим.
5. Формируем итог. Иногда картинке от «Миджорни» всё же необходимо человеческое вмешательство, и тогда наш графический дизайнер дорисовывает некоторые элементы, доделывает надписи, убирает лишние пальцы и прочие конечности.
До вмешательства дизайнера
После вмешательства дизайнера
Ну вот, собственно, и всё.
Пройдя этот нехитрый путь триста раз, мы создали (и продолжаем создавать) уникальные иллюстрации, радующие читателей и писателей.
Поделимся некоторыми лайфхаками, которые родил наш уже богатый нейросетевой опыт.
Структура промта
Успех в работе с «Миджорни» по-прежнему на сто процентов зависит от удачного промта. Чтобы добиться нужного результата, иногда приходится как следует поиграться с формулировками.
Как правило, структура нашего запроса выглядит так: объект, его детали и действия, обстановка, параметры кадра (ракурс, освещение, настройки камеры), стилистика.
Тогда промты получаются длинными:
«a black silhouette of a man in a suit and in a helmet with a lot of wires and tubes from helmet with his back to us in front of a bright cyberpank futuristic landscape in green colours by Enoch Bolles» (рассказ «Гугол»)
Но иногда наша задумка проста и рождает совсем короткий очевидный запрос:
Основная задача — сформулировать промт таким образом, чтобы избежать двоякого прочтения (а нейронки это очень любят) и «достучаться» человеческими словами до машинных алгоритмов.
Например, запрос «fragments of a room — a table, a book, window sills :: gray red color scheme by Charles Angrand» выдаёт среди прочего случайно запрошенную нами цветовую схему (картинки 2 и 3):
Но мы, понимая, что это не совсем то, что нужно, убираем лишнее и на «fragments of a room — a table, a book, window sills :: gray red colors by Charles Angrand» получаем уже более чистое:
Стилистика — ключевой параметр запроса
Наше самое любимое — это, конечно, эксперименты со стилями. Вот какие разные результаты получились, например, по запросу «a happy boy in a school uniform with a bouquet of asters stands at the school»:
...by Chris Ware
...by Saul Steinberg
...by Charles Schulz
...by Josh Agle
Или рассказ «Чары русалки» и результаты по запросу «a mermaid with blue hair sitting on a shelf in a train» с использованием стилей разных художников:
1/6
Играться с материалами и техниками — отдельное удовольствие:
В процессе работы над обложками мы выработали для себя такой лайфхак: иногда мы идём от обратного — сперва выбираем художника, стиль которого нравится, а затем переходим в режим «крадущийся тигр, затаившийся дракон» и ждём, когда река принесёт подходящий под идею рассказ. А ещё составляем заметки с указанием имени художника, где отмечаем, для какого рода текста он подойдёт. Вот так они могут выглядеть:
Иногда мы исходим из буквального содержания текста и изображаем его главного героя, ключевой предмет или обстановку; но бывает, что рисуем через метафоры или просто настроение рассказа — в общем, всё как с обычными иллюстрациями.
Например, вот какой получилась обложка к рассказу «Розовый слон»:
В общем, работа с нейросетями — это эксперименты, эксперименты, сплошные эксперименты!
Увидеть результат нашего цифрового творчества, убедиться, насколько безграничны возможности нейронок и как грамотный визуал помогает в восприятии текста можно в библиотеке www.prochitano.ru. Все обложки созданы нейросетью. Вход в библиотеку свободный, тишины не требуем.
Желаем вам лёгких промтов, клёвых результатов и спасибо за внимание!
P.S. Сейчас у нас новая творческая задача: с помощью Stable Diffusion создаём крутые QR-коды, ведущие в нашу библиотеку. Но об этом расскажем в следующий раз ;)
Да-да, я рабочий куар! Только камеру отводим чуть подальше ;)
1. ChatGPT — универсальный чат-бот, который умеет отвечать на запросы пользователя, поддерживать диалог, сочинять стихи, писать коды и сценарии и даже давать персональные советы. $20 в месяц. 2.Character.ai — куча нейросетей, способных имитировать поведение реальных личностей. Понимает русский язык, бесплатно. 3. Bard — чат-бот с искусственным интеллектом от Google. Бесплатно, работает только с VPN. 4.Poe — самые популярные нейросети в одном месте. Большая библиотека ботов для разных задач. Бесплатно, есть платные функции. 5.QuillBot — инструмент для перефразирования и суммирования текста. Понимает русский язык, бесплатно, есть премиум тариф. 6.PhotoRoom — сервисы для улучшения фото в одном месте: заменит/удалит фон, улучшит изображение и т.д. Бесплатно. 7.Civitai — сайт для обмена тысячами моделей искусственного интеллекта для нейросети Stable Diffusion XL. Бесплатно. 8.Midjourney — нейронная сеть, генерирующая изображения по текстовому описанию. Цена от $10. 9. Hugging Face — коллекция готовых, современных, предварительно обученных Deep Learning-моделей. Бесплатно. 10.Perplexity— бесплатный ИИ-поисковик. 11.YOU — бесплатный интеллектуальный поисковик, использующий ИИ для оптимизации результатов. Понимает русский язык. 12. Leonardo.AI — бесплатная альтернатива Midjourney. 13. Pixlr — инструмент для редактирования и дизайна, включает: удаление фона, фильтры и эффекты, шаблоны, анимации, коллажи. Бесплатно. 14.Forefront AI — достойная замена GPT-4. Также есть генерация изображений, настраиваемые персонажи и общий чат. Бесплатно, работает только с VPN. 15.Clipchamp — бесплатный онлайн-редактор видео с профессиональными функциями. 16.TheB.AI — аналог ChatGPT. Бесплатно, есть платные услуги. 17.NightCafe — бесплатный генератор изображений по текстовому описанию. 18.Replicate — платформа с тысячами моделей для лёгкого запуска, без необходимости установки нейросети на свой компьютер. 19.Speechify — преобразует текст в речь. Понимает русский язык, есть бесплатный период. 20.ElevenLabs — платформа для преобразования текста в реалистичную речь. Бесплатно, поддерживает 28 языков (русского пока нет). 21.Lexica — поисковая система по сгенерированным изображениям. Можно создавать свои изображения за $8 в месяц. 22.Veed.IO — создаст видеоролик на основе шаблонов, включая озвучку и музыку. Бесплатный экспорт с водяным знаком. 23.Tome — сервис для создания презентаций. Может сделать презентацию из обычного текстового файла. Генерирует на русском, но скачать слайды можно только платно. 24.AI Novel — нейросеть для создания историй, исходя из текстовой подсказки. Бесплатная пробная версия. 25.Cutout.pro — фоторедактор в браузере: раскрашивает ч/б фото, удаляет ненужные объекты, заменяет и удаляет фон, улучшает качество. Бесплатный пробный период. 26.VocalRemover — бесплатная нейросеть для создания минусов. Быстро и эффективно отделяет голос от музыки.
C помощью CLIP Interrogator и Llama2 на HuggingFace можно написать историю по картинке.
А что, очень удобно) Генерим картинку в Midjourney или в бесплатных Leonardo,
Stable Diffusion XL , загружаем в сервис и получаем готовую книгу, легкий заработок 🤌
Хотите узнавать первыми о полезных сервисах с искусственным интеллектомдля работы, учебы и облегчения жизни? Подпишитесь на мой тг (ссылка в описании) там я рассказываю, как использовать нейросети для бизнеса 😉
Специалисты по ИИ научились генерировать литературные произведения, которые очень сложно отличить от традиционных. Некоторые такие «книги» теперь входят в список бестселлеров на Амазоне и других площадках.
Например, Тим Бушэ «написал» с помощью ChatGPT 97 книг в жанре фантастики и заработал на них 2000 долларов. На создание одной книги у него уходит 6-8 часов. Тим собирается написать 1000 книг и увеличить доход в десять раз.
Те, кто ознакомился с трудами Тима, говорят, что это та ещё ахинея. Но копеечка капает.
Продолжаю серию постов "Будни неизвестного писателя"
Когда устраиваешь марафон на месяц по своим книгам, не забудь развлечь народ. Для этого не подойдут зашкварные фото из гугла и уж точно не нужны твои длинные жизнеутверждающие посты. Алё! Народ пытается читать романы и рассказы, где им найти время и силы, чтобы ещё философствовать в соцсети. При этом, развлекая, не забудь о том, что страничка у тебя не «весёлые мемы 2023», а всё же писательская.
Уже тогда я не пропускала новости о Midjourney и Stable Diffusion. В моих влажных мечтах я делала себе обложки и иллюстрации с помощью этой сети. Особенно после того, как узнала, сколько по цене может выйти качественная обложка у хорошего художника (до этого я клепала их сама в фотошопе, спасибо стокам и телескопу Хаббл).
Сначала я тысячу раз зарегалась в дискорте, затем начала творить. Честное пионерское, я хотела купить подписку, но представители широкой и необъятной, как все знают, лишились этой возможности. Почитала статьи на тему правильных промтов, чтобы не тратить попытки зря, и приступила. Я была в восторге! Вспомнились слова Спунера из фильма «Я, робот». Попросила Midjourney нарисовать мне локации из книг и некоторых персонажей, как уже реализованных, так и тех, кто находится на этапе идеи. На мой дилетантский взгляд, получилось здорово. Чтобы не быть голословной приведу парочку примеров.
Персонажи книг:
Локации:
В каких-то картинках было что-то от Нетфликс:
Но комон ребята, это ж роботы! Они рисуют!
Потом Midjourney обиделся на мальчишек и девчонок, с её помощью наряжающих Папу в жёлтый пуховик, и доступ к халявным генерациям закрылся. Я сориентировалась вовремя — спасибо мужу и крутому дядюшке XpucTу — установила Stable Diffusion. Вот примерчики от него. Персонажи:
Локации:
Страничка заиграла новыми красками. Убогие посты с жуткими фотками сменили качественные иллюстрации. Да, где-то я подшаманивала их в фотошопе, но не существенно. В общем, для такого нищеброда, как я, нейросеть — находка. Остаётся надеяться, что на результат подобного «творчества» законодательную лапу наложат не скоро.
У любой истории должен быть логический финал. Следующим постом постараюсь подвести черту.
Попались тут на глаза посты писателей с красивыми обложками их книг, которые любезно создала нейрсеть, в данном случае Midjorney. Так вот, все ли в курсе, что созданные вами с нейросетью иллюстрации принадлежат Midjourney, но вам дается на использование лицензия Creative Commons Noncommercial 4.0 Attribution International (СС 4.0.). Лицензия СС 4.0. запрещает коммерческое использование иллюстраций и обязывает указывать нейросеть, ссылку на лицензию и факт внесения изменений, если они были. Я так понимаю, что мало кто об этом в курсе. Вообще в иделе получить комментарии юристов, а то сейчас штампуют красивые обложки к книгам, что даже страшно становится за художников.
Всем Доброго времени суток, решил поделится тут своим творчеством, написал короткий рассказ, оформил его картинками через нейросеть, записал к нему звук и добавил звуковые эффекты, критика привествуется. Продолжение можете найти на канале.