Apple выпускает модель ИИ, которая может редактировать изображения на основе текстовых команд. Бесплатная демка

Модель под названием MLLM-Guided Image Editing (MGIE), которая использует мультимодальные модели большого языка (MLLM) для интерпретации текстовых команд при манипулировании изображениями.
Простыми словами это инструмент, который имеет возможность редактировать фотографии на основе текста, введенный пользователем.

Apple выпускает модель ИИ, которая может редактировать изображения на основе текстовых команд. Бесплатная демка Чат-бот, Инновации, ChatGPT, Искусственный интеллект, Нейронные сети, Apple

MLLM способны преобразовывать простые или двусмысленные текстовые подсказки в более подробные и четкие инструкции, которым может следовать сам фоторедактор. Например, если пользователь хочет отредактировать фотографию пиццы пепперони, чтобы «сделать ее более полезной», MLLM может интерпретировать это как «добавить овощную начинку» и отредактировать фотографию как таковую.

Apple выпускает модель ИИ, которая может редактировать изображения на основе текстовых команд. Бесплатная демка Чат-бот, Инновации, ChatGPT, Искусственный интеллект, Нейронные сети, Apple

В пиццу входят овощные начинки, например помидоры и зелень.

Помимо внесения серьезных изменений в изображения, MGIE также может обрезать, изменять размер и вращать фотографии, а также улучшать их яркость, контрастность и цветовой баланс с помощью текстовых подсказок. Он также может редактировать определенные области фотографии и может, например, изменять волосы, глаза и одежду человека на ней или удалять элементы на заднем плане.

Как отмечает VentureBeat , Apple выпустила модель через GitHub , но желающие также могут опробовать демо-версию , которая в настоящее время размещена на Hugging Face Spaces. Apple еще не сообщила, планирует ли она использовать то, чему она научилась в результате этого проекта, в инструменте или функции, которую можно будет включить в любой из своих продуктов.

Искусственный интеллект

2.6K поста9.9K подписчика

Добавить пост

Правила сообщества

Здесь вы можете свободно создавать посты по теме Искусственного интеллекта. Добро пожаловать :)


Разрешено:


- Делиться вопросами, мыслями, гипотезами, юмором на эту тему.

- Делиться статьями, понятными большинству аудитории Пикабу.

- Делиться опытом создания моделей машинного обучения.

- Рассказывать, как работает та или иная фиговина в анализе данных.

- Век жить, век учиться.


Запрещено:


I) Невостребованный контент

  I.1) Создавать контент, сложный для понимания. Такие посты уйдут в минуса лишь потому, что большинству неинтересно пробрасывать градиенты в каждом тензоре реккурентной сетки с AdaGrad оптимизатором.

  I.2) Создавать контент на "олбанском языке" / нарочно игнорируя правила РЯ даже в шутку. Это ведет к нечитаемости контента.


II) Нетематический контент

  II.1) Создавать контент, несвязанный с Data Science, математикой, программированием.

  II.2) Создавать контент, входящий в противоречие существующей базе теорем математики. Например, "Земля плоская" или "Любое действительное число представимо в виде дроби двух целых".

  II.3) Создавать контент, входящий в противоречие с правилами Пикабу.


III) Непотребный контент

  III.1) Эротика, порнография (даже с NSFW).

  III.2) Жесть.


За нарушение I - предупреждение

За нарушение II - предупреждение и перемещение поста в общую ленту

За нарушение III - бан