Завтра утром выложу подробный пост, как сделать такие открытки в Midjourney. Еще благодаря Midjourney можно сделать снимки, из которых получаются реалистичные AI-фильмы и трейлеры - например эти. Кто хочет обучиться всем тонкостям работы с самой реалистичной нейросетью для генерации изображений, добро пожаловать в Закрытый клуб Midjourneyс единомышленниками.
Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой телеграм канал НейроProfit, там я рассказываю, как можно использовать нейросети для бизнеса.
Понравились картинки к посту? Хочешь научиться быстро и просто генерировать предсказуемо крутой результат в Midjourney? Напиши мне и узнай подробности
Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой тг НейроProfit, там я рассказываю, как можно использовать нейросети для бизнеса
Вот такие криповые видео можно делать сPika Labs! А можно делать маркетинговые видео и ролики, набирающие просмотры на 🟥 YouTube. Чуть позже выложу пост про Pika Labs
Следите за обновлениями в моем ТГ Нейро Profitи подписывайтесь, если вам интересно, как использовать нейросети для бизнеса, учебы и работы
Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой тг НейроProfit, там я рассказываю, как использовать нейросети для бизнеса 😉
Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой тг (ссылка в описании профиля), там я рассказываю, как использовать нейросети для бизнеса
Не так давно, на сцену вышел ChatGPT-4v с возможностью распознавания изображений. Но на рынке есть и бесплатный аналог Llava, который также предлагает ряд уникальных функций. И, кстати, работает без VPN.
Желаете попробовать Llava прямо в браузере? Кликните здесь.
Если вы захотите установить его локально, воспользуйтесь этой ссылкой.
Почему Llava?
Этот инструмент распознает изображения, решает капчи и создает код на основе скриншотов. Преимущества Llava перед ChatGPT заключаются в том, что она бесплатна и работает без VPN. Русский язык понимают оба
Сравнение 1
Мои собственные эксперименты показали, что Llava может дать более лаконичные объяснения. Например, при анализе моего логотипа, который, к слову, был придуман с помощью ChatGPT (да, именно ChatGPT создал концепт моего телеграм канала!) Так вот, объяснение Llava мне понравилось больше, лаконичнее что ли...
1/2
Бесплатный Llava (рис 1) и ChatGPT-4 v (рис 2)
С другой стороны, при анализе оптической иллюзии, ChatGPT оказался более информативным, раскрыв принципы "амесовой комнаты" или "искаженной комнаты".
Сравнение 2
В этот раз я обоим скормила картинку, не говоря, что это оптическая иллюзия. Я спросила что это, и как такое возможно, Llava начал во всем видеть фотошоп и фотомонтаж:
Тогда я дала подсказку Llava убрать версию с Photoshop и фотомонтажом, но модель снова объяснила это спецеффектом камеры:
Llava
Я еще раз спросила как такое возможно в реальности, но Llava была непреклонна:
А ChatGPT просто сказал, что ничем мне помочь не может 🤷🏻♀
ChatGPT-4v
Далее я решила дать им обоим подсказку про иллюзию:
В ChatGPT я опять загрузила это изображение и спросила “Как такая иллюзия возможна? Версии с Photoshop и с фотомонтажом не принимаются” - вот тут он наконец мне выдал то, что я хотела:
ChatGPT-4v
ChatGPT расписал, что на картинке изображена оптическая иллюзия, которая часто называется "амесовой комнатой" или "искаженной комнатой” и описал принцип иллюзии, чего не скажешь про Llava, которая так конкретизировать не стала:
Llava
Вывод:
В итоге у обоих моделей -GPT-4v и Llava есть свои достоинства и недостатки, каждый по своему хорош. Так что Llava достойная бесплатная альтернатива платным функциям ChatGPT. А Dall-E 3 бесплатно (100 генераций в день) есть в Bing на русском, но работает с VPN
Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой тг НейроProfit, там я рассказываю, как использовать нейросети для бизнеса 😉
В прошлом посте я рассказывала про важные обновления ChatGPT-4 , в числе которых ChatGPT Vision - возможность распознавания изображений. Пользователь показал, как еще можно использовать ChatGPT Vision - разработка интерфейсов. Например, GPT-4V может воссоздать дэшборд веб-сайта из скриншотов или рисунков.
Как вам такое использование?)
Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой тг НейроProfit, там я рассказываю, как использовать нейросети для бизнеса
В октябре OpenAI представила Dall-E 3 в интерфейсе ChatGPTPlus и Enterprise и заверила, что новый Dall-E 3:
✔️ учитывает каждое слово в промпте;
✔️ на изображениях корректно выводится текст, кроме русского.
✔️ улучшена проработка сцены и взаимосвязь между объектами на изображении, отрисовка рук и других частей тела.
Генерировать изображения можно в самом диалоге с чат-ботом, что дает бесшовно переключаться между делами с текстом и изображениями, не покидая ChatGPT.
На видео пример такого взаимодействия между Dall-E 3 и ChatGPT -сказка про Лари, солнечного ежика, с иллюстрациями и прочим.
Я протестила Dall-E 3 и сравнила его с Midjourney
По исполнению реалистичных фото мне понравился больше Midjourney; в DALL-E 3 “все равно фото как компьютерные” - извините за каламбур 🤭
DALL-E 3 лучше отрисовывает руки, это однозначно! Так что если у вас студия маникюра, без напряга можно сгенерировать маникюр на пяти пальцах с первого раза 💅
Промпты DALL-E 3 тоже понимает лучше: для примера сгенерила изображения по одному промпту:
“Эфирная элегантность, изящный нейл-артистизм с бутылочками и украшениями из лака для ногтей, мягкие, приглушенные оттенки для легкой и нежной атмосферы, - без анатомической деформации рук” - Midjourney конечно обрисовала с присущей ей художественностью, только вот про руки забыла, зато DALL-E 3 точнопередал детали промпта:
Авторское право в DALL-E 3: пользователям запрещено генерировать изображение, если в описании указан ныне живущий художник или фотограф с целью защиты авторских прав. Однако,DALL-E 3 по-хитромупредлагаетпередать суть стиля художника, используя описательные термины и художественные направления:
DALL-E 3 предлагает решение
Перевод
Правда по достоверности передачи стиля художника мне ближе Midjorney.
Для примера, попросила DALL-E 3 и Midjorney сгенерировать изображения в стиле David Bailey по промпту:
1965 melodrama, New York in the style of David Bailey --ar 4:5 --s 350 --style raw
Вот оригинальные работы David Bailey
David Bailey
Вот как увидели стиль David Bailey Midjourney и DALL-E 3:
Все-таки лучше передал стиль фотографа Midjourney, изображения DALL-E 3 мало похожи на модельные фото, скорее на иллюстрации, и не передают почеркDavid Bailey, но это мое мнение
Вывод
Пока мне все же больше нравится Midjourney по исполнению и настройкам, не смотря на неоспоримые преимущества DALL-E 3. Я думаю, скоро мы с вами станем свидетелем гонки вооружений: Midjourney выкатит обновление, устранит баги с руками, улучшит понимание промпта, а DALL-E 3 улучшит исполнение и выпустит новые фишки, интересно будет понаблюдать) А вы что думаете? 🤔 Потестили уже DALL-E 3?
Хотите узнавать первыми о действительно полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой тг НейроProfit, там я рассказываю, как использовать нейросети для бизнеса 😉