Midjourney. Художник твоей мечты
5 постов
5 постов
Вдоволь наигравшись с рандомной генерацией любой дичи, которая приходила мне в голову и даже запилив небольшой гайд по Midjourney, мне пришла в голову идея попытаться сделать с ее помощью что-то более упорядоченное. Вспомнив новости о том, что с помощью нейросетей делали обложку для журнала и для фильма, решил попробовать сделать что-нибудь похожее. Выбор мой пал на Цоя и его песни, потому что а почему нет?
Для начала я убедился, что нейросеть вообще сможет понять, кто такой этот наш Цой. В целом это было не обязательно, учитывая что до этого она отлично справлялась с Гагариным или Лениным, потому что явно умеет в гугл-картинки для сравнения и понимания запросов.
В целом неплохо, учитывая что у нейросети есть определенные проблемы с пропорциями человеческих лиц и тел.
Следующие запросы содержали в себе дополнительные условия "группа Кино" и "постер".
А дальше я просто начал комбинировать приблизительно одинаковые запросы, меняя лишь названия песен и иногда добавляя дополнительные условия, когда обычные выдавали что-то скучное или не похожее на постеры. Вышло нечто вроде обложек к песням.
Звезда по имени Солнце
Группа крови
Пачка сигарет
Спокойная ночь
Кукушка
Место для шага вперед
Последний герой
Стук
К сожалению, я уже успел потратить свои 15 gpu-часов до этого, так что на данный момент мне доступен только slow-мод и недоступно улучшение картинок до максимального разрешения. А жаль, некоторые из этих постеров я с удовольствием бы распечатал.
О Midjourney за последние дни не слышал наверно только ленивый. Нейросеть, генерирующая потрясающие не всегда по своей красоте арты заинтересовала очень многих. И так как в комментах к постам с ней люди часто спрашивают о том, как оно вообще что и где, то я решил запилить короткий как оказалось нет и понятный надеюсь гайд на эту тему.
Для начала, коротко о том, какие есть версии на данный момент:
1) Бесплатная пробная версия - вам доступно 25 условных gpu-минут работы нейросети, что по сути есть примерно 25 картинок на стандартном для нее качестве.
2) Платная подписка Basic Membership - 10$ в месяц, 200 минут gpu в месяц, что приблизительно равняется 200 картинкам, и доступ к пользовательским галереям + Бот в личных сообщениях, позволяющий работать с нейросетью не в публичных каналах
3) Платная подписка Standard Membership - 30$ в месяц, неограниченное личное использование, что по факту равно примерно 15 gpu-часам, после использования которых вам включат slow-мод, но не отберут возможность делать картинки. + тот же доступ к галереям и бот в личных сообщениях дискорда.
4) Коммерческая платная подписка Corporate Membership - 600$ в месяц. Я думаю, дальше продолжать нет смысла.
Для начала работы с нейросетью вам понадобятся:
Дискорд - нейросеть работает только через него. Качаем-регистрируемся если вы еще не: discord.com
Авторизация и инвайт на сервер в дискорде через сайт www.midjourney.com
Гугл/Яндекс переводчик или знание английского на уровне, достаточном для вас самих, дабы можно было писать осмысленные запросы того, что вы хотите увидеть.
Главная страница сайта состоит ровно из двух кнопок.
Кнопка Sign In with Discord связывает ваш дискорд аккаунт с личной страницей на сайте, где вы можете посмотреть все ваши работы, а так же получить доступ к публичной галерее с работами других людей.
Кнопка Join the Beta дает вам инвайт на дискорд сервер Midjourney, где и происходит вся нейромагия.
Итак, вы скачали дискорд, зарегистрировались на сайте и получили доступ к серверу Midjourney.
Теперь вам необходимо пробиться в один из каналов newbies# (иногда они не прогружаются из за нереальной нагрузки на них, все что можно сделать- просто подождать или попытаться перезапустить сам дискорд).
Генерация изображений происходит через команду /imagine которую вы выбираете во всплывающем меню чата, когда начинаете набирать /
Поле prompt стандартное и обязательно должно присутствовать в запросе, так что если вы случайно удалили его- пересоздайте запрос через / и всплывающее меню с командами чата.
В это поле и вводятся все параметры и описания генерируемого изображения.
Простой пример: /imagine prompt:Pikabu , где единственным описанием, которое мы дали нейросети является слово Pikabu.
После ввода описания вы отправляете это сообщение в чат, и ждете первый вариант результатов.
Начальных результатов генерации всегда 4. Они низкого качества и сгенерированы очень условно, для того что бы показать, какого результата стоит ожидать.
Под картинкой с результатами есть поле с кнопками.
Кнопки U 1-4 отвечают за выбор варианта картинки, который вы хотели бы улучшать дальше.
Кнопки V 1-4 отвечают за выбор варианта картинки, на основе которого вы хотели бы сгенерировать следующие 4 варианта.
Кнопка со значком обновления заставит нейросеть перегенерировать картинки с нуля, используя этот же запрос.
Кнопка Web отправляет изображение в вашу галерею на сайте.
Выбрав понравившийся вариант (к примеру U2) мы получаем улучшенное по качеству генерации и апскейленное изображение.
На выбор после этого нам даются три кнопки:
Make Variations - использовать это изображение как основу для генерации четырех новых вариантов
Upscale to Max - улучшить изображение до максимального качества
Light Upscale Redo - легкая перерисовка конкретно этого варианта.
В конечном итоге нам выдают готовую картинку, которую мы опять же можем слегка переделать с помощью команды Light upscale Redo или использовать как основу для следующих итераций через Make Variations.
Итоговый результат нашего Pikabu:
Небольшое дополнение: эмодзи-реакцией X (большой красный крест) можно удалить свою работу из чата и галереи.
По сути это все, что вам нужно знать для простого использования Midjourney.
Дальше немного сложнее.
Поле prompt условно делится на три части: [url - текст - настройки].
Про то, как работать с готовыми картинками, заставляя нейросеть опираться на них или перерисовывать- я углубляться не стану, лучше разберемся с базовыми настройками генерации.
Настройки добавляются после текстового описания и содержат в начале "--".
Короткий список для базового использования:
--w - Ширина изображения. Работает лучше, если число кратно 64 (или 128 для --hd)
--h - Высота изображения. Работает лучше, если число кратно 64 (или 128 для --hd)
--ar -Задает желаемое соотношение сторон вместо ручной настройки высоты и ширины с помощью --h и --w. Например, --ar 16:9, чтобы включить соотношение сторон 16:9
--no - Исключение чего-то. Например -no plants - будет пытаться нарисовать картинку без растений.
--q <number> - "качество" изображения в плане генерации. От 0.25 до 5. Базовое значение стоит на 1, а на 5 он будет делать каждую картинку минут 5.
--hd - Использует другой алгоритм, который потенциально лучше подходит для больших изображений, но с менее согласованной композицией. Лучше всего подходит для абстрактных и пейзажных запросов.
--stop Остановить генерацию раньше. Значения от 10 до 100
/settings - Открывает поле с упрощенными настройками генерации, качества, приватности и т.д
/prefer option set <name> <value> - создание личной настройки. Например "/prefer option set mine --hd --w 512" - сделает настройку --mine с опциями "высота картинки 512 и высокое разрешение". Т.е можно вбивать вместо кучи опций только название своей настройки.
Пример: /imagine prompt: Sea of darkness --ar 16:9 --hd
Формат картинки 16:9, высокое качество.Больше настроек, а так же о работе с url и балансировкой между генерацией по картинке и описанию, можно найти в гайде на сайте нейросети: midjourney.gitbook.io/docs/user-manual
Дополнение о платной подписке:
Все мы знаем, что оплатить подписку просто так на данный момент невозможно.
Но есть довольно простой способ, который я использовал потому что эта хрень реально наркоманская, не оторваться очень хотелось иметь побольше часов работы. На сайте платиру (не реклама, ищите где хотите на самом деле) я купил предоплаченную американскую карту с 30 баксами на счету (ищется по запросу Visa 30). Она подошла, подписка активировалась, я доволен и могу генерировать дичь столько, сколько захочу. Всем добра и КиберЛенина.
Понимаю, что ничего нового по этой теме не напишу- все и так прекрасно знают, что есть у нас такая категория людей: жадные барыги. Подешевле купить, подороже впарить, в процессе делать вид, что они молодцы и помогают людям обрести то, что они желают.
Собственно говоря, все мы к ним привыкли и ничего с этим не поделать. Пусть этот пост будет считаться актом бессильного посылания лучей поноса одному конкретному барыге- глядишь кто-нибудь и передумает что-то у него покупать, если вдруг появится такое желание.
Итак, есть такая достаточно известная в определенных кругах китайская компания Anycubic. 3д принтеры выпускает. Имеет вполне себе официальный "магазин" на Алиэкспресс (и несколько дублирующих его менее официальных) , откуда свои товары и продает, в том числе со склада в РФ - для российского потребителя, и один единственный сайт в com сегменте для потребителя зарубежного. Никаких официальных магазинов кроме этого у них разумеется нет. Но разве это остановит предприимчивого барыгу? Да ни за что. И вот появляется сайт anycubic3d, который гордо позиционирует себя как "Официальный интернет-магазин 3D принтеров Anycubic со склада в России по низким ценам.". Чувствуете финт? Это не официальный магазин Anycubic, это "официальный магазин со склада в России". Доказательством их "официальности" является картинка сертификата (никаких печатей), сделать которую могу даже я, потратив минут 10 в любом графическом редакторе сложнее пеинта.
А вся суть моего негодования в том, что сегодня в их группе ВК была выложена реклама нового принтера Anycubic, от которой у меня, если честно, немного сгорело. Оцените сами:
Вот у нас скрин магазина Anycubic на Али с ценой этого принтера
А вот скрин с сайта нашего барыги
Каков масштаб, а? Да, это точно одна и та же комплектация- самая простейшая, и продается это дело с одного склада. Больше всего в этом мне понравилась благородно перечеркнутая "старая" цена 85000р, показывающая нам всю глубину души и щедрость человека, буквально отрывающего эти принтеры от себя.
Разумеется, выложив обе эти картинки в комменты к новости я получил бан, и разумеется это послужило причиной написания данного поста. Такие дела. Выводов нет, сути нет, есть немного подгоревший я и мой пост бессильной злобы. Не кормите барыг, ищите нормальные магазины.