2

Сравнение ChatGPT и Llava: кто лучше распознает изображения?

Не так давно, на сцену вышел ChatGPT-4v с возможностью распознавания изображений. Но на рынке есть и бесплатный аналог Llava, который также предлагает ряд уникальных функций. И, кстати, работает без VPN.

Желаете попробовать Llava прямо в браузере? Кликните здесь.

Если вы захотите установить его локально, воспользуйтесь этой ссылкой.

Почему Llava?

Этот инструмент распознает изображения, решает капчи и создает код на основе скриншотов. Преимущества Llava перед ChatGPT заключаются в том, что она бесплатна и работает без VPN. Русский язык понимают оба

Сравнение 1

Мои собственные эксперименты показали, что Llava может дать более лаконичные объяснения. Например, при анализе моего логотипа, который, к слову, был придуман с помощью ChatGPT (да, именно ChatGPT создал концепт моего телеграм канала!) Так вот, объяснение Llava мне понравилось больше, лаконичнее что ли...

Бесплатный Llava (рис 1) и ChatGPT-4 v (рис 2)

С другой стороны, при анализе оптической иллюзии, ChatGPT оказался более информативным, раскрыв принципы "амесовой комнаты" или "искаженной комнаты".

Сравнение 2

В этот раз я обоим скормила картинку, не говоря, что это оптическая иллюзия. Я спросила что это, и как такое возможно, Llava начал во всем видеть фотошоп и фотомонтаж:

Сравнение ChatGPT и Llava: кто лучше распознает изображения? Полезное, Искусственный интеллект, ChatGPT, Технологии, Чат-бот, Сравнение, Инновации, Digital, Нейронные сети, Бесплатно, Обзор, Будущее, Картинки, Иллюстрации, Иллюзия, Оптические иллюзии, Логотип, Капча, Код, Сайт, Видео, Длиннопост

https://t.me/NeuralProfit/391

Тогда я дала подсказку Llava убрать версию с Photoshop и фотомонтажом, но модель снова объяснила это спецеффектом камеры:

Сравнение ChatGPT и Llava: кто лучше распознает изображения? Полезное, Искусственный интеллект, ChatGPT, Технологии, Чат-бот, Сравнение, Инновации, Digital, Нейронные сети, Бесплатно, Обзор, Будущее, Картинки, Иллюстрации, Иллюзия, Оптические иллюзии, Логотип, Капча, Код, Сайт, Видео, Длиннопост

Llava

Я еще раз спросила как такое возможно в реальности, но Llava была непреклонна:

Сравнение ChatGPT и Llava: кто лучше распознает изображения? Полезное, Искусственный интеллект, ChatGPT, Технологии, Чат-бот, Сравнение, Инновации, Digital, Нейронные сети, Бесплатно, Обзор, Будущее, Картинки, Иллюстрации, Иллюзия, Оптические иллюзии, Логотип, Капча, Код, Сайт, Видео, Длиннопост

А ChatGPT просто сказал, что ничем мне помочь не может 🤷🏻‍♀

Сравнение ChatGPT и Llava: кто лучше распознает изображения? Полезное, Искусственный интеллект, ChatGPT, Технологии, Чат-бот, Сравнение, Инновации, Digital, Нейронные сети, Бесплатно, Обзор, Будущее, Картинки, Иллюстрации, Иллюзия, Оптические иллюзии, Логотип, Капча, Код, Сайт, Видео, Длиннопост

ChatGPT-4v

Далее я решила дать им обоим подсказку про иллюзию:

В ChatGPT я опять загрузила это изображение и спросила “Как такая иллюзия возможна? Версии с Photoshop и с фотомонтажом не принимаются” - вот тут он наконец мне выдал то, что я хотела:

Сравнение ChatGPT и Llava: кто лучше распознает изображения? Полезное, Искусственный интеллект, ChatGPT, Технологии, Чат-бот, Сравнение, Инновации, Digital, Нейронные сети, Бесплатно, Обзор, Будущее, Картинки, Иллюстрации, Иллюзия, Оптические иллюзии, Логотип, Капча, Код, Сайт, Видео, Длиннопост

ChatGPT-4v

ChatGPT расписал, что на картинке изображена оптическая иллюзия, которая часто называется "амесовой комнатой" или "искаженной комнатой” и описал принцип иллюзии, чего не скажешь про Llava, которая так конкретизировать не стала:

Сравнение ChatGPT и Llava: кто лучше распознает изображения? Полезное, Искусственный интеллект, ChatGPT, Технологии, Чат-бот, Сравнение, Инновации, Digital, Нейронные сети, Бесплатно, Обзор, Будущее, Картинки, Иллюстрации, Иллюзия, Оптические иллюзии, Логотип, Капча, Код, Сайт, Видео, Длиннопост

Llava

Вывод:

В итоге у обоих моделей -GPT-4v и Llava есть свои достоинства и недостатки, каждый по своему хорош. Так что Llava достойная бесплатная альтернатива платным функциям ChatGPT. А Dall-E 3 бесплатно (100 генераций в день) есть в Bing на русском, но работает с VPN

Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой тг НейроProfit, там я рассказываю, как использовать нейросети для бизнеса 😉