DALL·E 3 работает только с впн, можно сделать 100 бесплатных генераций, попробовать можно здесь.
prompt: photo of russian gorgon medusa with snakes instead of hair, walking down street in manhattan, wearing balenciaga hypebeast streetwear, blue hour
Если приближать и разглядывать фотографии, то будет видно, что далли делает размазанные глаза, в этом плане у миджи нет косяков. Ещё далли прописала бренд, змеи на головах более живые и как будто бы в движении, миджи всегда делала просто лежащих, и не всегда на голове.
prompt: an astronaut stands on the planet Jupiter and looks at the dawn, First Person View, Space Commander, Rainmeter, HUD Rise UI, futuristic interface
Здесь обе нейросети хорошо справились, у миджи разве что чёткость чуть получше.
prompt: shot by slim aarons of wonder woman in the room, complex layers and textures, detailed character design, background with bright, whimsical and colorful scenes, pastel colour correction like Wes Anderson movie, film grain, tokina at-x 11-16mm f/2.8 pro dx ii
Здесь далли однозначно справилась хуже, у неё получилось в яркие цвета стилей, но совсем не получилось в чёткость деталей, появились деформированные тела на фоне, лица совсем не удались.
prompt: USSR fairy in astronaut costume with wings
Решила также затестить фото c феями, но далли упорно не хотела делать фотографии, пришлось дописать photo of и на конце shot on agfa vista, миджи не проигнорила крылья, потому что был закинут реф с крыльями. Ещё были интересные варианты, когда всё-таки далли сделала фото, но с афроамериканкой.
prompt: 1990s, jedi Leonardo DiCaprio on russian dacha holding a lightsaber wearing knitted green sweater , shot on Agfa Vista 400
Далли очень круто отразила колорит русской дачи, добавила зерна плёнки и цветокор, сделала молодого Дикаприо, классные текстуры свитера. Миджи хорошо отразила цветокор плёнки, Дикаприо сделала постарше.
prompt: 80s, photo of plump cute fat cats in aerobics class, wearing funny leopard leggings and pink bodysuits, shot on Kodak Gold 200
Котики снова на высоте, и та и другая нейросеть отлично понимает плёночные камеры, но далли даже зерно добавляет на изображения.
prompt: street photo, beautiful fantasy elf sitting next to orc, wearing nike sportswear and holding ice cream
Далли хорошо справилась с реализацией героев, мы видим орка и эльфа с эльфийскими ушами, спорт-костюм найк также присутствует, но глаза размазанные. Миджи чаще всего игонорирует эльфийские заострённые уши, найк также проигнорирован. У меня есть пост, где я писала о том, что Stable Diffusion XL отлично справилась с эльфами и орками, можно посмотреть здесь.
prompt: pastel colors bubble figure in the style of ray tracing, feminine sculpture, metallic finishes, shiny/glossy, colorful turbulence, pigeoncore, unconventional poses, anamorphic art, in the style of rendered in cinema4d, iridescence/opalescence, video feedback loops, shiny eyes, bold curves, shiny, fluid figuratism
Получилось интересно и там и там.
prompt: Donald Duck and Webby Vanderquack in Michelangelo's The Creation of Adam painting
Далли смогла с первой попытки реализовать позы с картины и руки, понку проигнорировали обе нейросети, миджи же даже с рефами так приблизиться к картине не смогла.
prompt: 2280s, Award-winning photo by Petra Collins of beautiful adult fairy moves around the city in the air on a futuristic flying board, she flies up to her forest modern technological house, magic realism
Далли намного точнее отразила промпт, феи реально на летающей доске и они с крыльями, миджи всё время сажала на непонятной формы летательные аппараты вместо досок, крылья тоже чаще всего игнорировала, но при этом далли снова ушла больше в иллюстрацию и зашакалила лица, миджи же в фотореализм, чёткость лица у неё на высоте.
prompt: Award-winning photo by slim Aarons of Albert Einstein shows tongue on Burning Man in candypunk fashion, moonlight, Golden Ratio, magic realism
В миджи Эйнштейн похожим получается только с добавлением его фото-референса и присвоения ему веса 2, далли же сделала его узнаваемым без рефа и с первой попытки, но как экспонат, а не живым, а также смогла высунуть язык, в миджи это не реализуемо, я в итоге в фотошопе допиливала язык.
Сделала сайт-статью сравнение, потому что тут можно только 25 изображений, а их вышло 82.
Приглашаю вас досмотреть и поделиться потом обратной связью. Там писала свои комментарии и выводы.