Честный обзор генератора изображений DALL-E 3 в ChatGPT. Сравнение с Midjourney
Предыстория
В октябре OpenAI представила Dall-E 3 в интерфейсе ChatGPT Plus и Enterprise и заверила, что новый Dall-E 3:
✔️ учитывает каждое слово в промпте;
✔️ на изображениях корректно выводится текст, кроме русского.
✔️ улучшена проработка сцены и взаимосвязь между объектами на изображении, отрисовка рук и других частей тела.
Генерировать изображения можно в самом диалоге с чат-ботом, что дает бесшовно переключаться между делами с текстом и изображениями, не покидая ChatGPT.
На видео пример такого взаимодействия между Dall-E 3 и ChatGPT - сказка про Лари, солнечного ежика, с иллюстрациями и прочим.
Я протестила Dall-E 3 и сравнила его с Midjourney
По исполнению реалистичных фото мне понравился больше Midjourney; в DALL-E 3 “все равно фото как компьютерные” - извините за каламбур 🤭
Но зато в DALL-E 3, интегрированным в ChatGPT, можно прям в диалоге попросить дописать, например, на банке крема “Natural” - он напишет:
С русским языком пока проблемы, мое “привет” он написал, видимо, на своем языке) Ну Midjourney написала явно не лучше:
DALL-E 3 лучше отрисовывает руки, это однозначно! Так что если у вас студия маникюра, без напряга можно сгенерировать маникюр на пяти пальцах с первого раза 💅
Промпты DALL-E 3 тоже понимает лучше: для примера сгенерила изображения по одному промпту:
“Эфирная элегантность, изящный нейл-артистизм с бутылочками и украшениями из лака для ногтей, мягкие, приглушенные оттенки для легкой и нежной атмосферы, - без анатомической деформации рук” - Midjourney конечно обрисовала с присущей ей художественностью, только вот про руки забыла, зато DALL-E 3 точно передал детали промпта:
Авторское право в DALL-E 3: пользователям запрещено генерировать изображение, если в описании указан ныне живущий художник или фотограф с целью защиты авторских прав. Однако, DALL-E 3 по-хитрому предлагает передать суть стиля художника, используя описательные термины и художественные направления:
DALL-E 3 предлагает решение
Перевод
Правда по достоверности передачи стиля художника мне ближе Midjorney.
Для примера, попросила DALL-E 3 и Midjorney сгенерировать изображения в стиле David Bailey по промпту:
1965 melodrama, New York in the style of David Bailey --ar 4:5 --s 350 --style raw
Вот оригинальные работы David Bailey
David Bailey
Вот как увидели стиль David Bailey Midjourney и DALL-E 3:
Все-таки лучше передал стиль фотографа Midjourney, изображения DALL-E 3 мало похожи на модельные фото, скорее на иллюстрации, и не передают почерк David Bailey, но это мое мнение
Вывод
Пока мне все же больше нравится Midjourney по исполнению и настройкам, не смотря на неоспоримые преимущества DALL-E 3. Я думаю, скоро мы с вами станем свидетелем гонки вооружений: Midjourney выкатит обновление, устранит баги с руками, улучшит понимание промпта, а DALL-E 3 улучшит исполнение и выпустит новые фишки, интересно будет понаблюдать) А вы что думаете? 🤔 Потестили уже DALL-E 3?
Хотите узнавать первыми о действительно полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой тг НейроProfit, там я рассказываю, как использовать нейросети для бизнеса 😉
Потерянные во времени
Права на произведения, созданные Midjourney
Кому принадлежат произведения, созданные ИИ? /для удобства термином "ИИ" я буду называть в том числе языковые модели и нейросети/. Это один из вопросов, который привёл меня в ИТ право. Когда я был молодой и незрелый, я даже полагал, что существует огромная правовая и экзистенциальная коллизия. Ведь с одной стороны, есть творческий труд ИИ, а с другой отсутствие у него субъектности. Но всё оказалось намного проще. Если это конечно не сферический ИИ в вакууме, у него есть создатель и тот, кто поддерживает его работу. И именно он определяет кому что принадлежит, пока законодатель не решил иначе.
Для примера возьмём условия сервиса Midjourney. Предположим, вы загрузили туда картинку и на её основе создали новые. В условиях пользования указано, что если у вас есть подписка на сервис, то вы являетесь единственным правообладателем всех сгенерированных изображений. При этом ваши права сохраняются даже после окончания срока подписки. Кроме того, на определённых тарифах Midjourney “приложит все усилия”, чтобы уже сгенерированные изображения не были опубликованы (т.е. без гарантий).
Если же подписки нет - то Midjourney предоставляет вам на сгенерированные изображения всего лишь лицензию Creative Commons Noncommercial 4.0 Attribution International. Она разрешает использование изображений только в некоммерческих целях и требует указания авторства.
Теперь о картинке, которую вы скормили Midjourney. Загружая её в сервис, вы предоставляете Midjourney кучу прав. Причём как в отношении неё, так и вводимых текстов (т.н. prompts). А именно: бессрочную, всемирную, неисключительную, бесплатную, безвозмездную, безотзывную лицензию на воспроизведение, создание производных работ, публичную демонстрацию, публичное исполнение, с правом сублицензирования. Она сохранится в силе даже после прекращения пользования сервисом.
Кроме того, ваши изображения будут доступны для публичного просмотра и могут быть изменены. И это тоже входит в лицензию, которую вы предоставляете Midjourney. Однако, на определённых тарифных планах платной подписки можно включить настройки, которые ограничат видимость загружаемых изображений и текстов для других пользователей.
Таким образом, надо хорошо подумать прежде чем что-то загружать в подобные сервисы, ведь они смогут использовать это по своему усмотрению сколько угодно времени. В том числе для обучения своей ИИ. Ну и надо понимать, что сгенерированные изображения не совсем ваши, пока вы не платите Midjourney деньги.
тг-канал: IT-юрист в эмиграции
YouTube миниатюры в Midjourney для канала про технологии
Вот такой фон для YouTube миниатюры можно сгенерировать в Midjourney.
Prompt
A detailed visualization of a neural network, depicted as glowing interconnected nodes and pathways, set against a dark, digital matrix-like backdrop. Medium: Photo hyper-realism. Style: Futuristic tech visualization. Lighting: Ambient backlighting with neon highlights on the neural nodes. Colors: Deep blacks and blues for the background, contrasted with neon blues and purples for the neural network. Composition: Canon EOS 5D Mark IV DSLR camera, EF 24mm f/1.4 lens, Resolution 30.4 megapixels, ISO sensitivity: 100, Shutter speed 1/250 second, central focus on the neural network with a depth-of-field effect. --ar 16:9 --v 5.1 --style raw --q 2 --s 750
Prompt
Close-up of a silicon chip with intricate patterns, symbolizing the architecture of neural networks. From the chip, light rays emanate outward, representing data flow and computations. Medium: Photo hyper-realism. Style: Macro tech photography. Lighting: Soft overhead lighting with a spotlight on the chip's details. Colors: Metallic grays of the chip with radiant blues and golds for the light rays. Composition: Nikon D850 DSLR camera, Nikkor 50mm f/1.4 lens, Resolution 45.7 megapixels, ISO sensitivity: 64, Shutter speed 1/200 second, sharp focus on the chip's details with the light rays slightly diffused. --ar 16:9 --v 5.1 --style raw --q 2 --s 750
Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой тг НейроProfit, там я рассказываю, как использовать нейросети для бизнеса
Пишем книжки по картинке
C помощью CLIP Interrogator и Llama2 на HuggingFace можно написать историю по картинке.
А что, очень удобно) Генерим картинку в Midjourney или в бесплатных Leonardo,
Stable Diffusion XL , загружаем в сервис и получаем готовую книгу, легкий заработок 🤌
Хотите узнавать первыми о полезных сервисах с искусственным интеллектомдля работы, учебы и облегчения жизни? Подпишитесь на мой тг (ссылка в описании) там я рассказываю, как использовать нейросети для бизнеса 😉
LeonardoAI добавили новую функцию Photo Real
Я уже рассказывала про LeonardoAI и его функционал здесь
Я решила протестировать новую функцию Photo Real.
Как можно догадаться из названия, функция предназначена для создания реалистичных изображений в разных стилях, в том числе и cinematic
Для этого переходим во вкладку AI Image Generation → Photo Real → Настраиваем глубину резкости: Высокое, Среднее и Низкое значения.
💡Чем больше значение - тем лучше фокус
Чем меньше значение - тем более размытые фото
Генерация 4-х картинок стоит 20 токенов из бесплатных 150, которые обновляются каждые 9 часов.
Что самое интересное: стоимость более размытого изображения со значением Medium будет стоить так же как и более четкое изображение, где выставлена высокая степень резкости
Leonardo конечно хорош, но по сравнению с Midjourney, это игрушка, и он не дает того функционала. Ведь не даром Midjourney бесспорныйй лидер в генерации стоящих изображений 🔥
Хотите узнавать первыми о полезных сервисах на ии для работы, учебы и упрощения жизни? Подпишитесь на мой тг НейроProfit , там я рассказываю, как зарабатывать с помощью нейросетей и использовать ии-сервисы для бизнеса 😉
Фотореалистичные макеты современного сайта UI/UX
[Product: Website], [Purpose: UI/UX Design], [Mood: Modern], [Style: Photorealism], [Background: Minimalist]Create dynamic and modern website UI/UX mockups that showcase the product or service in the best light. The mockups should be photorealistic with attention to detail, including typography and spacing. The background should be minimalist and allow the product or service to take center stage
[Продукт: Веб-сайт], [Цель: UI/UX дизайн], [Настроение: Современное], [Стиль: Фотореализм], [Фон: Минимализм]Создайте динамичные и современные UI/UX макеты веб-сайта, которые покажут продукт или услугу в лучшем свете. Макеты должны быть фотореалистичными, с вниманием к деталям, включая типографику и интервалы. Фон должен быть минималистичным и позволять продукту или услуге занять центральное место.
Хотите быть в курсе о полезных ии сервисах для работы, учебы и облегчения жизни? Подпишитесь на мой канал в Telegram НейроProfit, там я рассказываю о том, как зарабатывать с помощью нейросетей и использовать ии-сервисы для бизнеса 😉