Dall-E 2 vs. Midjourney: Сравнение самых популярных нейросеток
Буквально за считанные недели "рисующие" нейросети штормом захватили интернет. Их удивительные возможности поражают воображение и заставляют с небольшой опаской, но и надеждой, задуматься о будущем таких технологий. Вот и я не осталась в стороне, попробовав сравнить опытным путем две самые популярные из них - Midjourney и Dall-E 2.
Работают нейросети по одному принципу: они способны сгенерировать картину по текстовому запросу (Text to Image AI), но, несмотря на похожую логику, результаты получаются совершенно разные.
Мне , как графическому дизайнеру и иллюстратору, очень часто в последнее время задают вопрос: "А не боишься ли ты, что ИИ заберет у тебя работу?" Ну, как сказать... И фотошопа когда-то боялись точно также... Несмотря на хайп, Ничего пренципиально нового в этой технологии нет, но только недавно, с открытием бета версий для широкой публики, стало понятно насколько могущественнен этот инструмент и насколько далеко он шагнул.
В общем, к эксперименту!
Условия:
1. Синтаксические запросы в обеих программах абсолютно одинаковы и составлены на английском языке.
2. Взят только первый сгенерированный результат (И Midjourney и Dall-E 2 генерируют 4 вариации одной картинки. Для чистоты экперимента, тут представлена самая первая)
3. Результаты полностью созданы нейросетью и не проходили никакой пост-обработки
Ну, что ж, начем уже наконец...с чего-нибудь простого..
С аниме девочек!
Синтакс: Pretty anime-style Asian girl with cat ears, wearing red Japanese clothes
Перевод: Симпатичная азиатка в стиле аниме с кошачьими ушками, одетая в красную японскую одежду
В общем, с самым популярным запросом- красивыми девушками - обе сетки справляются на ура. Можно сразу заметить, что Далл-и любит в реализм, даже если в синтаксе был указан конкретный стиль. Мид же, наоборот, по умолчанию вырисовывает картины, и иногда игнорирует указания к реализму. В общем, тут зависит от ваших вкусовых предпочтений.
Далее я решила-таки добавить к промпту гипер-ультра-мега реализм! (Промпт - это текстовая комманда, по которой программа будет отрисовывать ваш запрос) И вот что получилось!
Синакс: photo realistic render of a druid woman wearing a tiara with bright green eyes shimmering lights around her Dynamic lighting cinematic
Перевод: Фото реалистичный рендер девушуки друида с тиарой и яркими зелеными глазами переливающийся свет вокруг нее динамичное синематографичное освещение
Что еще я заметила, играясь с сеточками - артефакты. У Мида артефактов гораздо больше. Программа особенно часто ошибается с глазами и носами, добавляя, в лучшем случае, непонятные линии, в худшем - копирует части лица. Особенно это видно , как только портрет разворачивается в три-четверти или профиль. Иногда выходили очень уж странные монстрики. Плюсик для Далли - он не особо часто этим грешит.
В общем, с портреткой все понятно, пришло время смотреть пейзажи!
Синакс: landscape forest, dark, mystic forest, pleasant light, cinematic light, fantasy forest
Перевод: пейзаж лес, мрачный, мистический лес, приятное освещение, синематографичное освещение, фантастический лес
Обе нейросети отлично справляются с пейзажами, но лично мне больше заходит сюрреалистический и артистический стиль MidJourney. Игра света и тени + композиция делают картины очень легкими дял восприятния и можно часами просто на них смотреть, как в галерее.
Синакс: Fuji mountain by Ivan Aivazovsky
Перевод: Гора Фудзи, написанная Иваном Айвазовским
Обе картины, конечно, вышли потрясающе, но тут можно заметить небольшое преимущество MidJourney над Dall-e - возможность менять формат. В MidJourney достаточно указать добавить в конце предложения " - ar 16:9 " и будет вам счастье! На момент написания статьи, Далли такого не делает.
Ну и напоследок, конечно же, хлебо-котики
Синакс: cat made of bread
Перевод: кот, сделанный из хлеба
Выводы
В качестве небольшого дисклеймера, позвольте отметить, что обе нейросети сейчас находятся к состоянии бета тестирования. То есть они только в начале своей длинного и многообещающего пути! Какая из них больше подойдет вам - дело личное, и зависит от многих факторов, не только стиль результатов но и стоимость и но я пришла к таким:
Midjourney — для темного фэнтези, ужасов и различных жанров научной фантастики. Отлично справляется с фэнтэзийными и фото-релистичными портретами, сценами и концепциями окружающей среды. Куча дополнительных инструментов для более точной настройки в промпте (в том числе новые --stylize и --quality) и отличная отправная точка для дальнейшего редактирования , перекрашивания, фотообработки, идельно для идей, о которых вы зачастую бы даже не подумали.
Dall-E 2 - лучше в фотоискусстве, фотореализме, разработке концепций реальных продуктов и некоторых типах художественных стилей. Как мне показалось, Dall-E лучше понимает контекст и показывает именно то, что вы хотели увидеть или, как минимум, что-то очень близкое. Также, Dall-E 2 может различать два субьекта, ставить их рядом или морфить их вместе, в то время как Midjourney испытывает трудности, если в картине присутсвует больше чем два субьекта.
Вот такие вот дела!
А вы уже успели поиграться с нейросетями? Что думаете?
Я знаю, что еще существует Disco Diffusion и Stable Diffusion и планирую скоро до них тоже добратьсяю. Так что комментируйте, если такой формат поста был интересен и хочется еще!
Спасибо за внимание!
Генерация нейросетью
по слову "Хунзах".
Что думают нейросети о сельском хозяйстве
Минутка аграрного юмора
Вот вещают нам из каждого утюга:
- за цифровизацией будущее
- искусственный интеллект - сила
- за нейросетями - будущее
И понесло же простого колхозника узнать: что же думают нейросети о сельском хозяйстве
Ну для начала узнаем, что такое сельское хозяйство в понятии нейросетей
Мама дорогая, из относящегося к сельскому хозяйству опознал в верхней правой части поле, вспаханное старым плугом с кривой отбивкой загонок
Спросим еще раз?
Это творение перебравшего абсента художника хотя бы отдаленно похоже на тему запроса
Ой, а нейросеть понимает 107 языков. Вспоминаю любимое выражение фермера, у которого жил во время стажировки в Германии: "Das ist Landwirtschaft" (Это - сельское хозяйство, употреблялось когда дела шли... не по плану, в общем)
Чем то напоминает творение тевтонской инженерной мысли от Nexat
Уборка урожая
Не, это не абсент, это бурачный самогон коньяк "Три свеклы"
Озимая пшеница
Отдаленно похоже. Ладно, перейдем к любимому подсолнечнику
Лень искать, но в фото селекционной коллекции попадались такие уродцы, после применения химического мутагенеза
А как же мой любимый семенной подсолнечник?
Бррр...
Про участок гибридизации подсолнечника спрашивал с затаенным ужасом
Интересно, что послужило основой?
Кукуруза
В виде поделки из детского сада
Сельхозтехника... Тут нейросеть выдала по нескольку вариантов
Трактора
Видимо после управления пьяными механизаторами
И комбайны
Видимо вертикального взлета
Вспомним про животноводство
Простая коровка, мирно пасущаяся на лугу (именно так сформулирован запрос)
Может не надо больше?
Ладно, спросим как выглядит нейросеть, рисующая картинки про сельское хозяйство.
Судя по всему внизу тот самый перебравший абсента художника
Интересно, как будут выглядеть картинки через год, два, три??? Как будет идти развитие разума нейросетей?
Нейросеть - быть или не быть?
Вот так нарисовала нейросеть по тегам "Мертвый мир, люди кричат, страх, мать.
А какие картины выдавала нейросеть по вашим тегам?
Что будет, если скрестить разных животных, в представлении нейронной сети
1) слон 🐘 + божья коровка 🐞
2) кошка 🐈 + дракон 🐉
3) коза 🐐 + дельфин 🐬
4) лев 🦁 + осьминог 🐙
Dalle-2 - "Море и Космос" на основе картины с Карпами кои
Решил попробовать поэкспериментировать с созданием видео на основе контента генерируемого Dalle-2
За основу я взял картину, которую на день рождение мне подарила pak_ha_photo и далее я уменьшал исходное изображение в два раза и "просил" нейросеть дорисовать свободное место вокруг, и так повторял снова и снова.
DALL·E 2 — мои первые эксперименты и возможности нейросети - часть 3
Итак продолжим предыдущие части материала:
- Часть 1
- Часть 2
После предыдущих пейзажей я решил посмотреть на варианты пейзажей с осенью вместо лета и сменить стиль с акварели на масло
An impressionist oil painting painting of Rybinsk with view from water on bridge, museum and church at autumn time
Затем я решил попробовать режим работы с созданием вариантов по готовому изображению.
Я взял картинку медведя-пивовара из моего туристического пэт-проекта, и запросил нейросеть создать другие варианты эскиза. И получилось на удивление не плохо
Затем я опробовал вариант дорисовки\перерисовки изображения — взял картинку медведя, и запросил Bear in engineering helmet and blueprints in hands и разметив область головы и рук (вместо секиры)
Далее я решил посмотреть, что будет если разметить все изображение как возможное место для перерисовки с запросом Bear in watercolor type with Rybinsk museum background
И еще раз попробовал варианты, в этот раз вышло более коряво для медведя с секирой
Продолжим пробы с вариантами — тут я использовал свою фотографию с фестиваля в косплее на Иванушку из Морозко
Конкурс для мемоделов: с вас мем — с нас приз
Конкурс мемов объявляется открытым!
Выкручивайте остроумие на максимум и придумайте надпись для стикера из шаблонов ниже. Лучшие идеи войдут в стикерпак, а их авторы получат полугодовую подписку на сервис «Пакет».
Кто сделал и отправил мемас на конкурс — молодец! Результаты конкурса мы объявим уже 3 мая, поделимся лучшими шутками по мнению жюри и ссылкой на стикерпак в телеграме. Полные правила конкурса.
А пока предлагаем посмотреть видео, из которых мы сделали шаблоны для мемов. В главной роли Валентин Выгодный и «Пакет» от Х5 — сервис для выгодных покупок в «Пятёрочке» и «Перекрёстке».
Реклама ООО «Корпоративный центр ИКС 5», ИНН: 7728632689