Думаете мы тут шутки шутить собрались? Цитирую "В субботу, 17 февраля, в Пермском крае пройдет гонка на лопатах. Пермякам нужно будет на скорость спуститься с горы на садовом инструменте. Информация об этом размещена в официальном сообществе всесезонного курорта «Губаха»"
Adobe во время Adobe MAX 2023представили мощные обновления 🔥
Firefly
Начнем с ИИ-продуктов для дизайнеров - Firefly для Illustrator создает векторные изображения по тексту с нуля, и с его помощью можно генерить рекламные макеты, логотипы и принты:
Firefly Vector
Firefly Vector - “первая генеративная модель для создания векторной графики":
Firefly Vector
Firefly Design
Firefly Design нарисует макеты для рекламы по промпту:
Firefly Design
Firefly Image Model 2
Firefly Image Model 2 - улучшенный генератор изображений, отлично генерит людей и понимает ваши картинки в качестве референсов:
Adobe Project Fast Fill — Generation Fill для видео, В Adobe Premiere добавили возможность убирать и дорисовывать предметы и менять фон по текстовому промпту:
Adobe утверждает, что это работает даже в сложных сценах с меняющимся освещением. Парню из видео легко сменили галстук и перекрасили рубашку:
Project Draw & Delight
Project Draw & Delight - можно нарисовать эскиз и добавить текстовую подсказку, а ИИ Adobe с помощью Firefly для Illustrator (с которого я начала)преобразует эскиз в векторный рисунок:
Project Poseable
Project Poseable - инструмент, с помощью которого пользователи смогут использовать модели генерации изображений для быстрого рендеринга 3D-сцен с персонажами:
Project Primrose
Project Primrose - умный материал для одежды, который меняет свой цвет и рисунок по нажатию кнопки. Пока что Project Primrose не продается, но компания уже запатентовала материал, так что в скором времени нас ждет новый модный материал:
Project Stardust
Project Stardust - позволяет выделять объекты в новый слой. Объекты можно менять на что угодно с помощью встроенной нейросети:
Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и упрощения жизни? Подпишитесь на мой тг НейроProfit, там я рассказываю, как использовать нейросети для бизнеса
В октябре OpenAI представила Dall-E 3 в интерфейсе ChatGPTPlus и Enterprise и заверила, что новый Dall-E 3:
✔️ учитывает каждое слово в промпте;
✔️ на изображениях корректно выводится текст, кроме русского.
✔️ улучшена проработка сцены и взаимосвязь между объектами на изображении, отрисовка рук и других частей тела.
Генерировать изображения можно в самом диалоге с чат-ботом, что дает бесшовно переключаться между делами с текстом и изображениями, не покидая ChatGPT.
На видео пример такого взаимодействия между Dall-E 3 и ChatGPT -сказка про Лари, солнечного ежика, с иллюстрациями и прочим.
Я протестила Dall-E 3 и сравнила его с Midjourney
По исполнению реалистичных фото мне понравился больше Midjourney; в DALL-E 3 “все равно фото как компьютерные” - извините за каламбур 🤭
DALL-E 3 лучше отрисовывает руки, это однозначно! Так что если у вас студия маникюра, без напряга можно сгенерировать маникюр на пяти пальцах с первого раза 💅
Промпты DALL-E 3 тоже понимает лучше: для примера сгенерила изображения по одному промпту:
“Эфирная элегантность, изящный нейл-артистизм с бутылочками и украшениями из лака для ногтей, мягкие, приглушенные оттенки для легкой и нежной атмосферы, - без анатомической деформации рук” - Midjourney конечно обрисовала с присущей ей художественностью, только вот про руки забыла, зато DALL-E 3 точнопередал детали промпта:
Авторское право в DALL-E 3: пользователям запрещено генерировать изображение, если в описании указан ныне живущий художник или фотограф с целью защиты авторских прав. Однако,DALL-E 3 по-хитромупредлагаетпередать суть стиля художника, используя описательные термины и художественные направления:
DALL-E 3 предлагает решение
Перевод
Правда по достоверности передачи стиля художника мне ближе Midjorney.
Для примера, попросила DALL-E 3 и Midjorney сгенерировать изображения в стиле David Bailey по промпту:
1965 melodrama, New York in the style of David Bailey --ar 4:5 --s 350 --style raw
Вот оригинальные работы David Bailey
David Bailey
Вот как увидели стиль David Bailey Midjourney и DALL-E 3:
Все-таки лучше передал стиль фотографа Midjourney, изображения DALL-E 3 мало похожи на модельные фото, скорее на иллюстрации, и не передают почеркDavid Bailey, но это мое мнение
Вывод
Пока мне все же больше нравится Midjourney по исполнению и настройкам, не смотря на неоспоримые преимущества DALL-E 3. Я думаю, скоро мы с вами станем свидетелем гонки вооружений: Midjourney выкатит обновление, устранит баги с руками, улучшит понимание промпта, а DALL-E 3 улучшит исполнение и выпустит новые фишки, интересно будет понаблюдать) А вы что думаете? 🤔 Потестили уже DALL-E 3?
Хотите узнавать первыми о действительно полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой тг НейроProfit, там я рассказываю, как использовать нейросети для бизнеса 😉
Теперь работать с ChatGPT стало удобнее благодаря русскоязычному интерфейсу 😉
Правда, регистрация через российскую SIM-карту по-прежнему недоступна, и VPN все же нужно включать 😕 А как зарегистрироваться в ChatGPT из России я уже рассказывала
Ниже рассказываю про новые функции распознавания голоса и изображений 👇🏼
ChatGPT теперь может распознавать голос и изображения
Пользователи с подпиской Plus и Enterprise смогут общаться с помощью голоса с ChatGPT (iOS и Android)- система конвертирует голос в текстовый запрос, генерирует ответ и озвучивает его. Так же появилась возможность интегрировать изображения в разговор, распознавание изображений доступно на всех платформах. Вскоре доступ откроют для всех.
Распознавание голоса:
Можно взаимодействовать с ChatGPT с помощью голоса, вести обратную связь в разговоре. Работает на основе новой модели текста в речь, способной генерировать человекоподобное аудио из текста и нескольких секунд образца речи.
Функция включается в Настройках:
Настройки → Новые функции на мобильном приложении, затем включить голосовые разговоры. Далее нужно нажать на кнопку наушников в верхнем правом углу главного экрана и выбрать предпочитаемый голос из пяти различных вариантов.
Распознавание изображений:
Теперь можно показать ChatGPT одно или несколько изображений, описать проблему, например, чтобы решить неполадку велика или обсудить содержимое холодильника.
Как работает:
Необходимо нажать на кнопку фото, чтобы сделать снимок или выбрать изображение. На iOS или Android сначала нажмите на кнопку плюс.
Распознавание изображений работает на основе мультимодальных моделей GPT-3.5 и GPT-4.
То есть можно будет вести полноценный диалог и показывать то, о чем вы говорите через фотки или картинки из сети. Фотографируете памятник, отправляете фото ChatGPT, а тот голосом рассказывает всё, что о нём знает. А вы продолжаете задавать вопросы — тоже голосом.
Не смотря на то, что есть плагины WebPilot и LinkReader, лучше всего с поиском в интернете и переходом на сайты справлялась именно браузерная версия ChatGPT благодаря Bing. Раньше эту опцию убирали из-за того, что Bing мог заходить «куда не надо», например без проблем брал инфу из платных и закрытых источников. Сейчас это пофиксили и вернули ногмальгый поиск в инете, а значит информация не ограничивается 2021 годом.
Больше полезных сервисов с искусственным интеллектом в моем телеграм канале (ссылка в описании профиля), все инсайты и новости я размещаю в сторис, чтоб не захламлять ленту, и вы сразу могли найти полезные нейросети для работы, учебы и бизнеса