2

Сравнение ChatGPT и Llava: кто лучше распознает изображения?

Не так давно, на сцену вышел ChatGPT-4v с возможностью распознавания изображений. Но на рынке есть и бесплатный аналог Llava, который также предлагает ряд уникальных функций. И, кстати, работает без VPN.

Желаете попробовать Llava прямо в браузере? Кликните здесь.

Если вы захотите установить его локально, воспользуйтесь этой ссылкой.

Почему Llava?

Этот инструмент распознает изображения, решает капчи и создает код на основе скриншотов. Преимущества Llava перед ChatGPT заключаются в том, что она бесплатна и работает без VPN. Русский язык понимают оба

Сравнение 1

Мои собственные эксперименты показали, что Llava может дать более лаконичные объяснения. Например, при анализе моего логотипа, который, к слову, был придуман с помощью ChatGPT (да, именно ChatGPT создал концепт моего телеграм канала!) Так вот, объяснение Llava мне понравилось больше, лаконичнее что ли...

Бесплатный Llava (рис 1) и ChatGPT-4 v (рис 2)

С другой стороны, при анализе оптической иллюзии, ChatGPT оказался более информативным, раскрыв принципы "амесовой комнаты" или "искаженной комнаты".

Сравнение 2

В этот раз я обоим скормила картинку, не говоря, что это оптическая иллюзия. Я спросила что это, и как такое возможно, Llava начал во всем видеть фотошоп и фотомонтаж:

<!--noindex--><a href="https://pikabu.ru/story/sravnenie_chatgpt_i_llava_kto_luchshe_raspoznaet_izobrazheniya_10766590?u=https%3A%2F%2Ft.me%2FNeuralProfit%2F391&t=https%3A%2F%2Ft.me%2FNeuralProfit%2F391&h=0b1778059a6ac2b5f5417a112b3b030245aae64e" title="https://t.me/NeuralProfit/391" target="_blank" rel="nofollow noopener">https://t.me/NeuralProfit/391</a><!--/noindex-->

https://t.me/NeuralProfit/391

Тогда я дала подсказку Llava убрать версию с Photoshop и фотомонтажом, но модель снова объяснила это спецеффектом камеры:

Llava

Llava

Я еще раз спросила как такое возможно в реальности, но Llava была непреклонна:

А ChatGPT просто сказал, что ничем мне помочь не может 🤷🏻‍♀

ChatGPT-4v

ChatGPT-4v

Далее я решила дать им обоим подсказку про иллюзию:

В ChatGPT я опять загрузила это изображение и спросила “Как такая иллюзия возможна? Версии с Photoshop и с фотомонтажом не принимаются” - вот тут он наконец мне выдал то, что я хотела:

ChatGPT-4v

ChatGPT-4v

ChatGPT расписал, что на картинке изображена оптическая иллюзия, которая часто называется "амесовой комнатой" или "искаженной комнатой” и описал принцип иллюзии, чего не скажешь про Llava, которая так конкретизировать не стала:

Llava

Llava

Вывод:

В итоге у обоих моделей -GPT-4v и Llava есть свои достоинства и недостатки, каждый по своему хорош. Так что Llava достойная бесплатная альтернатива платным функциям ChatGPT. А Dall-E 3 бесплатно (100 генераций в день) есть в Bing на русском, но работает с VPN

Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой тг НейроProfit, там я рассказываю, как использовать нейросети для бизнеса 😉