Упарываемся с нейросетью Stable Diffusion
Увидел мимоходом пост о нейросети Midjourney (Торжество искусственного интеллекта, или мой опыт взаимодействия с нейросетью Midjourney). Игрушка показалась весьма интересной, но, во-первых, работает через бота в Дискорде, с устройством которого мне не охота было разбираться, а во-вторых, в перспективе я бы не потянул подписку на неё (бесплатно можно воспользоваться только 25 раз).
Оказалось, у неё есть халявный конкурент - Stable Diffusion. Причём один из способов доступа к ней - сайт, который позволяет генерировать картинки без ограничений, даже не требуя регистрацию: huggingface.co. Только придётся отстоять очередь из таких же любопытных товарищей. Создатели сети не претендуют на авторские права, что позволяет использовать эти изображения в коммерческих целях.
Midjourney, к слову, с недавних пор тоже может пользоваться алгоритмами Stable Diffusion.
Сначала я попробовал запросы, требующие прорисовки лиц. Результат получился предсказуемо жмыхнутым.
70's rock band
Однако больше всего моему припозднившемуся пубертату захотелось сгенерировать девку. Была одна попытка за кадром, и из четырёх портретов одна получилась хорошечной. Как живая, с симметричными глазами, с естественными мохнатыми брежневскими бровями... Будем пробовать ещё.
dark-haired girl from the 80's with a cine camera
Кхэм!.. Надо было уточнить, что mature girl... Кто засунул Оззи Осборна в ребёнка?
О, а вот эта хорошо получилась. Симметрично и не крипово. Напоминает солистку Liliac.
Я неслучайно добавил cine camera в запрос. Как любитель аналоговой фотокинотехники, я за кадром уже попытался сгенерировать киносъёмочный аппарат. Поржал знатно! Ни одно из устройств не было похоже на кинокамеру, потому что органы управления и объективы торчали откуда угодно, но не из тех мест, на которых они должны находиться. В некоторых случаях вместо объектива была просто сквозная линза.
Надо отметить, что поставленная задача заставила нейросеть родить нечто реально похожее на камеру. Только это фотоаппарат. И, да, весьма интересный хват у девушки... XD
А вот это было действительно смешно! Нейросеть попыталась нарисовать Полароид, но что-то пошло не так.
Ладно, наигрались с упоротыми людьми, теперь попробуем порисовать что-то иное. У британской рок-группы Fancy была песня Star Lord. Неизвестно, взяли ли они этого персонажа из головы, или было какое-то реальное фэнтези про него, но это точно не СтарЛорд из марвеловских комиксов - его создали на 3 года позднее выхода песни. Что ж, попросим нейросеть представить, что это за звёздный лорд такой.
Star Lord Of The Shadow (по первой строчке песни)
Блин... Я надеялся на что-то абстрактное, но нейросеть сложила все четыре яйца в одну корзину с марвеловским персонажем.
Supermarine Spitfire
Ну, она попыталась...
А что, если назвать конкретный предмет? Сможет ли она воспроизвести его, сохраняя как можно больше деталей?
mail box
Да, сможет.
А теперь попробуем абстракцию. Возьму строчки из песни Topo and Robi - Under The Ice
Once upon a time
There was a land so bright
On a planet far away now
A planet full of light
Ох, нихрена се! Пожалуй, хватит на сегодня, пока она не вызвала кого-нибудь...