Midjourney + Инновации

С этим тегом используют

70 постов сначала свежее

Neurosonya

1 год назад

Серия Полезность

Фотореалистичные макеты современного сайта UI/UX⁠⁠

https://t.me/NeuralProfit/315

[Product: Website], [Purpose: UI/UX Design], [Mood: Modern], [Style: Photorealism], [Background: Minimalist]Create dynamic and modern website UI/UX mockups that showcase the product or service in the best light. The mockups should be photorealistic with attention to detail, including typography and spacing. The background should be minimalist and allow the product or service to take center stage

[Продукт: Веб-сайт], [Цель: UI/UX дизайн], [Настроение: Современное], [Стиль: Фотореализм], [Фон: Минимализм]Создайте динамичные и современные UI/UX макеты веб-сайта, которые покажут продукт или услугу в лучшем свете. Макеты должны быть фотореалистичными, с вниманием к деталям, включая типографику и интервалы. Фон должен быть минималистичным и позволять продукту или услуге занять центральное место.

Хотите быть в курсе о полезных ии сервисах для работы, учебы и облегчения жизни? Подпишитесь на мой канал в Telegram НейроProfit, там я рассказываю о том, как зарабатывать с помощью нейросетей и использовать ии-сервисы для бизнеса 😉

Показать полностью 1

[моё] Искусственный интеллект Нейронные сети Digital Полезное Дизайн Будущее Ux Дизайнер Стиль Midjourney Картинки Эстетика Технологии Инновации

thefutureidol

1 год назад

Искусственный интеллект

Серия Нейронки

Апдейт Midjourney: веб-версия, прокаченный апскейл, 3D-генерация и видео-генерация⁠⁠

Новая версия Midjourney позволит пользователям создавать 3D-модели и сцены. Это открывает новые возможности для творчества, например, для создания реалистичных игр, фильмов и анимационных проектов.

В ближайшем будущем ожидается поэтапный запуск веб-версии с мощным улучшением качества изображений до 2K и выше, работающим в несколько раз быстрее текущего.

Midjourney также анонсировала Midjourney Video. Судя по всему, новая модель обещает превзойти конкурентов по качеству генераций.

Midjourney продолжает оправдывать наши ожидания!

Источник мой Телеграм паблик: https://t.me/thefutureidol

Показать полностью

[моё] Искусственный интеллект Технологии Инновации Midjourney Нейронные сети Арты нейросетей 3D Видео Без звука

Timeweb.Cloud

1 год назад

Лига Новых Технологий

Серия Технологии

Perfusion. Это как Midjourney, только лучше⁠⁠

Автор: TilekSamiev
Оригинальный материал

Когда дело доходит до автоматического создания изображений на основе собственных идей, на помощь приходят две самых популярных среди пользователей нейросети — DALL-E 2 и Midjourney. Обе являются инструментами, способными создавать реалистичные изображения с хорошим качеством. Эти ИИ обычно понимают, чего вы хотите, и пытаются генерировать новые изображения, в том числе что-то похожее на конкретный пример, но часто можно увидеть, что результат совершенно не соответствует запросам. Что ж, это изменится с новой моделью от NVIDIA — Perfusion, нейросетью, которая позволяет создавать изображения из описаний на естественном языке.

В отличие от своих тяжеловесных конкурентов, Perfusion выделяется компактным размером моделей всего в 100 КБ и 4-минутным временем обучения. Perfusion предлагает пользователям возможность комбинировать различные настраиваемые элементы с набором изображений, которые функционируют как «концепции». Модель способна изучить «концепцию» объекта (например, вещи, животного или человека), а затем генерировать эти концепции в новых сценариях.

❯ Всё дело в концепции

Модель преобразования текста в изображение (T2I) — это алгоритм машинного обучения, который позволяет пользователям писать подсказки на естественном языке для создания изображения, сгенерированного ИИ. Модели T2I предлагают новый уровень гибкости, позволяя пользователям управлять творческим процессом. Однако персонализация этих моделей в соответствии с визуальными концепциями, предоставленными пользователями, остаётся сложной проблемой. Задача персонализации T2I ставит перед собой множество сложных задач, таких как поддержание высокой визуальной точности, объединение нескольких персонализированных концепций в одном изображении и сохранение небольшого размера модели. Perfusion может решить эти задачи.

Основная фишка Perfusion заключается в его новой технике Key-Locking («блокировка ключей»). Связывая определённые концепции с другими концепциями во время создания изображений, Perfusion может создавать больше версий начальной концепции, сохраняя при этом её суть. Это позволяет пользователям персонализировать изображения с помощью определённых объектов, например, таким как «кот», сохраняя при этом уникальные характеристики, которые определяют конкретного «кота».

Блокировка ключей смягчает проблему переобучения, из-за чего модели сложно создавать новые версии идеи, потому что она тесно связана с изображениями, на которых она изначально обучалась. Perfusion корректирует математические преобразования, превращающие слова в картинки. Key-Locking позволяет модели связывать конкретные запросы пользователей с более широкой категорией или «надкатегорией». Например, запрос на создание кота побудил бы модель сопоставить термин «кот» с более широкой категорией «кошачий». После этого выравнивания модель обрабатывает дополнительные сведения, предоставленные в текстовом запросе пользователя.

Привязав нового кота к общему понятию «кот», модель может изобразить кота во многих различных позах, внешности и окружении. Но кот по-прежнему будет сохранять свою «кошачесть», которая делает его похожим на определённого кота, а не просто на случайного Барсика. Например, можно добавить концепцию «шляпа» к концепции «кот» и «блокировать ключ» общей концепции «кот в шляпе». Любое переобучение происходит на основе введённых новых концепций, а не всей модели, что означает меньшую потребность в дорогостоящих вычислительных мощностях и хранилищах.

Проще говоря, Key-Locking позволяет ИИ гибко отображать персонализированные концепции, сохраняя при этом их основную идентичность. Это всё равно, что давать художнику следующие указания: «Нарисуй моего кота Тома, когда он спит, играет с мячиком и нюхает цветы».

Еще одно преимущество модели Perfusion заключается в её адаптивности. В зависимости от требований пользователя модель можно настроить так, чтобы она строго соответствовала текстовой подсказке, или предоставить определённую степень творческой свободы в своих выходных данных. Эта универсальность гарантирует, что модель может быть точно настроена для получения результатов, варьирующихся от точных до более общих, в зависимости от конкретных потребностей пользователя.

Фронт Парето

Это позволяет пользователям легко исследовать фронт Парето (сходство текста и сходство изображений) и выбирать оптимальный компромисс. Важно отметить, что обучение модели требует некоторой ловкости. Слишком сильное сосредоточение на воспроизведении модели приводит к тому, что модель снова и снова выдает один и тот же результат, а слишком точное следование текстовому запросу без какой-либо свободы обычно приводит к плохому результату. Гибкость настройки того, насколько близко генератор следует запросу, является важной частью настройки.

Текстовый запрос преобразуется в серию кодировок. Каждое кодирование подаётся в модули перекрёстного внимания диффузионного шумоподавителя U-Net (фиолетовые блоки). U-Net демонстрирует, как кодирование текста влияет на пути ключа и значения

❯ Меньше значит лучше

Perfusion основывается на Stable Diffusion с дополнительными механизмами для захвата и одновременного создания нескольких «концепций». В отличие от существующих генераторов изображений, которые изучают концепции изолированно, Perfusion позволяет нескольким персонализированным концепциям сосуществовать в одном изображении с естественным взаимодействием. Эта открывает перед художниками новые возможности для экспериментов и создания уникального визуального контента.

Perfusion может обеспечить более анимационные результаты с лучшим сопоставлением подсказок и меньшей восприимчивостью к фоновым чертам исходного изображения. Для сравнения для каждой концепции прилагаются образцы из обучающего набора, а также сгенерированные изображения, их кондиционирующие тексты с текущих методов Custom-Diffusion, Dreambooth и Textual-Inversion.

Сравнение результата Perfusion с другими методами

Другие генераторы AI изображений тоже могут предлагать варианты тонкой настройки, но их громоздкий размер может быть недостатком. Самые популярные модели T2I, в том числе Stable Diffusion и Dall-E, имеют миллиарды параметров, что означает, что они занимают несколько гигабайт в автономном режиме. Для Perfusion требуется всего 100 КБ пространства, что является впечатляющим достижением по сравнению с Midjourney, для которого требуется более 2 гигабайт хранилища. Сверхэффективный размер позволяет просто обновлять те части, которые нужны, по сравнению с методами, которые обновляют всю модель.

Для справки: LoRA — это популярный метод точной настройки, используемый в Stable Diffusion. Он может добавить к приложению от десятков мегабайт до более одного гигабайта. Другой метод, Textual-Inversion, легче, но менее точен. Модель, обученная с помощью Dreambooth, самого точного метода на данный момент, весит более 2 ГБ.

Эффективно блокировать концепции и уменьшать размер модели удаётся с помощью метода, называемого редактированием модели ранга-1. В современных моделях преобразования текста в изображение, основанных на Custom-Diffusion всегда есть текстовая подсказка, которая закодирована для извлечения соответствующей информации. Эта информация так или иначе добавляется, обычно через механизм перекрестного внимания к процессу генерации изображений, который является итеративным процессом. Редактирование ранга-1 контролирует то, что появляется в конечном изображении.

Качество изображения, создаваемое моделью Perfusion, примерно такое же, как у Stable Diffusion v1.5. С точки зрения эффективности, благодаря лёгкому объёму, эффективность модели Perfusion находится в «первом эшелоне» в отрасли.

Это всё ещё не идеально, но это большой шаг вперёд для моделей преобразования текста в изображение с полным контролем над генерацией. Здесь модель ещё борется с сохранением идентичности объекта, который ему отправляется. Объекта, который является «суперкатегорией», что иногда приводит к чрезмерному обобщению, поскольку некоторые суперкатегории слишком широки и включают много разных объектов или специфических стилей, которые не обязательно нужны. Объединение концепций пока ещё требует большого количества оперативной инженерной работы, что является ещё одной причиной научиться делать текстовые запросы лучше.

❯ Новый игрок

Инновации в Perfusion пользователям делиться своими персонализированными концепциями в виде небольших дополнительных файлов, избегая необходимости делиться громоздкими контрольными точками модели. Это также делает персонализацию моделей менее затратной, открывая больше возможностей для большего количества людей.

С точки зрения распространения, модели, адаптированные для конкретных организаций, легче распространять или развёртывать на периферии. По мере того, как практика преобразования текста в изображение становится всё более популярной, возможность добиться такого значительного уменьшения размера без ущерба для функциональности будет иметь первостепенное значение.

Однако важно отметить, что Perfusion в первую очередь обеспечивает персонализацию модели, а не саму полную генеративную способность. Несмотря на то, что этот метод многообещающий, он имеет некоторые ограничения. Авторы отмечают, что критический выбор во время обучения может иногда чрезмерно обобщать концепцию. По-прежнему необходимы дополнительные исследования, чтобы легко объединить несколько персонализированных идей в одном изображении.

Nvidia сообщила о планах выпустить код в будущем, что позволит более широко изучить и понять потенциал этой компактной нейронной сети. Хотя код Perfusion пока недоступен, заявленный авторами план подразумевает, что эта эффективная персонализированная система искусственного интеллекта может со временем попасть в руки разработчиков, отраслей и создателей.

Это исследование согласуется с растущим вниманием Nvidia к ИИ. По мере роста спроса на технологии искусственного интеллекта Nvidia стратегически позиционирует себя как доминирующего игрока в этой области. Акции компании выросли более чем на 230% в 2023-м году, поскольку её графические процессоры продолжают доминировать в моделях обучения ИИ. Учитывая, что такие компании как Google, Microsoft и Baidu, вкладывают миллиарды в генеративный ИИ, инновационная модель Perfusion от Nvidia может дать ей преимущество.

Помимо Perfusion, Nvidia также разработала Omniverse Audio2Face, инструмент, который позволяет создавать 3D-анимации из аудио. Кроме того, с начала года стало известно, что компания разрабатывает драйверы на основе ИИ для оптимизации производительности своих видеокарт.

Более подробная информация о Perfusion представлена на выставке SIGGRAPH 2023.

Больше интересных статей в нашем блоге на Хабре. Недорогие сервера для ваших проектов — здесь.

Показать полностью 8

[моё] Изобретения Инновации IT Технологии Техника Timeweb Midjourney Nvidia 3D Искусственный интеллект Длиннопост

Neurosonya

1 год назад

Серия Полезность

Подборка готовых запросов для нейронок (картинки)⁠⁠

https://t.me/NeuralProfit/288

AI Prompt Generator – сайт сгенерирует лучший промт по вашему запросу

Stable Diffusion Prompt Generator – генератор для Stable Diffusion

Prompthero – очень много артов с промптами

Midjourney Prompt Generator – генерация промта по вашему запросу для Midjourney

Показать полностью 1

[моё] Искусственный интеллект Нейронные сети Полезное Digital ChatGPT Чат-бот Midjourney Бесплатно Картинки Технологии Инновации Шаблон Подборка Дизайн Идея Запросы Дизайнер Художник

Neurosonya

1 год назад

Серия Видео

Kaiber vs GEN-2: Оживление Ferrari GTC4Lusso! Кто лучше?⁠⁠

Создание уникальных видео из изображений и текста с помощью нейросетей (AI)

Ferrari GTC4Lusso глазами Kaiber и GEN-2! 🔥

Я сгенерировала в Midjourney фото Ferrari GTC4Lusso. Кто делает круче -Kaiber или GEN-2?

Хотите узнать, как создать такие же крутые Shorts, Reels и TikTok с помощью ии, да и в целом использовать нейросети для работы или бизнеса, подписывайтесь на мой Telegram-канал НейроProfit , я обозреваю полезные сервисы

Показать полностью

[моё] Сравнение Искусственный интеллект Digital Нейронные сети Технологии Вертикальное видео YouTube Midjourney Youtube Shorts Instagram Reels Instagram TikTok Инновации Ролики Развлечения Картинки Монтаж Сервис Автомобилисты Ferrari Видео

neuroarthero

1 год назад

OpenAI, Google поставит водяные знаки на контент, созданный ИИ, чтобы предотвратить дипфейки⁠⁠

Семь компаний пообещали Байдену, что предпримут конкретные шаги для повышения безопасности ИИ.

Семь компаний, в том числе OpenAI, Microsoft, Google, Meta, Amazon, Anthropic и Inflection, взяли на себя обязательство разработать технологию, позволяющую наносить водяные знаки на контент, созданный искусственным интеллектом. Администрация Байдена надеется, что это поможет сделать более безопасным обмен текстом, видео, аудио и изображениями, созданными ИИ, не вводя других в заблуждение относительно подлинности этого контента.

В настоящее время неясно, как будет работать водяной знак, но, скорее всего, он будет встроен в контент, чтобы пользователи могли проследить его происхождение до инструментов искусственного интеллекта, которые использовались для его создания.

Дипфейки стали новой проблемой как для интернет-пользователей, так и для политиков, поскольку технологические компании пытаются решить, как поступить со спорным использованием инструментов ИИ.

Ранее в этом году генератор изображений Midjourney использовался для создания поддельных изображений ареста Дональда Трампа , которые впоследствии стали вирусными. Хотя для многих было очевидно, что изображения были фальшивыми, Midjourney все же решил предпринять шаги, чтобы забанить пользователя, который их сделал . Возможно, если бы водяной знак был доступен тогда, этот пользователь, основатель Bellingcat Элиот Хиггинс, никогда бы не столкнулся с такими суровыми последствиями за то, что, по его словам, было не попыткой умничать или обмануть других, а просто повеселиться с Midjourney.

Однако есть и другие более серьезные случаи неправильного использования инструментов ИИ, когда водяной знак может помочь спасти некоторых интернет-пользователей от боли и раздоров. Ранее в этом году сообщалось, что программное обеспечение, генерирующее голос ИИ, использовалось для выманивания у людей тысяч долларов, а только в прошлом месяце ФБР предупредило о росте использования дипфейков, созданных ИИ, в схемах сексуального вымогательства .

Белый дом заявил , что водяной знак позволит «творчеству с ИИ процветать, но снизит опасность мошенничества и обмана».

OpenAI сообщила в блоге , что согласилась «разработать надежные механизмы, включая системы происхождения и/или водяных знаков для аудио- или визуального контента», а также «инструменты или API для определения того, был ли конкретный фрагмент контента создан с помощью их системы». Это будет применяться к большинству контента, созданного ИИ, за редкими исключениями, такими как отсутствие водяных знаков для голосов помощников ИИ по умолчанию.

Ещё статьи о нейросетях и технологиях. https://t.me/neuroarthero

Показать полностью

[моё] Искусственный интеллект Инновации Нейронные сети Технологии Midjourney Будущее Арты нейросетей Компьютерная графика Видео

user6732435

1 год назад

ChatGPT

ChatGPT + компьютерное зрение⁠⁠

В этой статье мы рассмотрим реализацию и примеры работы ChatGPT с компьютерным зрением.

Я занимаюсь разработкой своего ChatGPT Telegram бота на Python. Мне пришла идея использовать компьютерное зрение для поиска текста на изображение, для составления запроса в ChatGPT.

Реализация

Tesseract — это популярный движок OCR с открытым исходным кодом, который был предварительно обучен для поддержки более 100 языков. В этой статье мы используем Python-tesseract (pytesseract), оболочку Python для Tesseract, которая позволяет использовать Tesseract с Python.

Прежде чем использовать Tesseract, его нужно установить. Не забудьте добавить русский язык в параметрах установки.

pip install pytesseract

Вместе с ChatGPT получится что то такое

pip install openai

Примеры

Все примеры будут показаны в моем Telegram боте, так как это удобнее, чем через консоль, ну и ради продвижения, конечно же...

Бот бесплатный. Имеет большой функционал. Всю информацию найдете внутри.

Telegram бот может обрабатывать фотографию в двух режимах:

Получение текста с изображения без запроса в ChatGPT. Для этого нужно написать команду /text в подписи к изображению или оставить это поле пустым.
Обработка текста с использованием инструкции для ChatGPT. Инструкция (запрос) пишется в подписи к изображению.

Попробуем распознать текст с этой фотографии документа, сделанной на телефон.

Есть неточности, но в целом не плохо

Попробуем решить тестовое задание с применением ChatGPT.

Как насчет рукописного текста

Рукописный текст печатными буквами распознает крайне плохо, пропись нет смысла даже проверять.

Что то из очень смешного

Обработка теста с изображения

Текст с картинки можно озвучить, используя функцию озвучки бота в настройках

Как по мне, вполне себе применимая штука получилась. Может пригодится. Все примеры вы можете опробовать сами, воспользовавшись Telegram ботом.

Забавная версия))

@ChatGptT01_Bot

Показать полностью 13 2

Искусственный интеллект ChatGPT Технологии IT Инновации Telegram Python Программирование Разработка Программист Google Нейронные сети Midjourney Машинное обучение Программа Бот Боты Видео Вертикальное видео Длиннопост

Партнёрский материал

specials

Узнавать о том, как работают люди других профессий, полезно!⁠⁠

Потому что так можно почерпнуть для себя лайфхаки, которые (надеемся) упростят жизнь или поспособствуют продвижению по карьерной лестнице.

ЧИТАТЬ СОВЕТЫ

Работа Лайфхак Текст

Cartoshechka

1 год назад

Лига Новых Технологий

Сказ про лошадей, ИИ, и рынок труда⁠⁠

Привет, читатель, наверное у тебя уже глаза болят от иллюстраций midjourney, да постов о всемогущем CHAT-GPT? Понимаю! Но, что поделать если нейросети настолько многофункциональны, что затрагивают едва ли не каждую сферу жизни. В заголовках то и дело советуют «напрячься» маркетологам, копирайтерам, программистам, дизайнерам, да что уж тут говорить, под угрозой даже такая профессия как врач!

Нейропетух на нейрополе.

Нейросети грозятся обесценить и заменить всех и каждого, но есть одно НО. Большинство людей не умеет, да и не хочет правильно формулировать задачу, а для нейросети — это одно из важнейших условий правильного результата. Оставим в стороне то, что даже флагманский Chat-gpt периодически «придумывает» информацию и выдает неверные данные, это безусловно вопрос времени.

«Не дай бог жить в эпоху перемен» - ~~(с) Винни Пух~~ гласит старинная китайская пословица, а нам досталось счастье опровергнуть или подтвердить ее.

Нейросети не уничтожают рабочие места, они просто меняют процесс работы. К примеру, с развитием интернета, каждый может при плохом самочувствии найти симптомы в сети, но правильный диагноз поставит лишь врач, если же у специалиста будет такой инструмент как нейросеть, это лишь ускорит процесс поиска решения. С появлением компьютерной графики хоронили художников, но они живее всех живых, так же как и графические н.сети лишь помогут быстрее создавать продукт, но быстрее не равно лучше. Прогресс не остановить, но вполне под силам обуздать, к сожалению РФ в такой переломный для мира момент оказалась изолирована, что может сильно пошатнуть и так не самое безоблачное будущее.

Программист, дизайнер и маркетолог после выпуска Chat-GPT 5?

Всё, что нам кажется новым, уже было. С появлением автомобиля, тысячи аналитиков пророчили безработицу конюхам, производителям корма, телег, да уборщикам навоза. На деле же автопром создал многомиллиардный рынок и тысячи рабочих мест. И, что немаловажно, повлиял на скорость и эффективность работы остальной промышленности. Примерно то же самое будет и с развитием нейросетей.

Мир без автомобилей, который мы потеряли...

Основная опасность автоматизации хранится не в замещении «роботами» людей, даже если роботы прокачаны нейронкой. А в том, что нейросети могут способствовать тоталитарному контролю населения, как это уже происходит в Китае. Усеет ли человечество принять меры по недопущению такого исхода, мы узнаем совсем скоро!

Показать полностью 4

[моё] Нейронные сети Технологии Научная фантастика Будущее Робот Инновации Изобретения Midjourney ChatGPT Длиннопост

Посты не найдены

3 4 5 6 7 8 9