Не так давно, на сцену вышел ChatGPT-4v с возможностью распознавания изображений. Но на рынке есть и бесплатный аналог Llava, который также предлагает ряд уникальных функций. И, кстати, работает без VPN.
Желаете попробовать Llava прямо в браузере? Кликните здесь.
Если вы захотите установить его локально, воспользуйтесь этой ссылкой.
Почему Llava?
Этот инструмент распознает изображения, решает капчи и создает код на основе скриншотов. Преимущества Llava перед ChatGPT заключаются в том, что она бесплатна и работает без VPN. Русский язык понимают оба
Сравнение 1
Мои собственные эксперименты показали, что Llava может дать более лаконичные объяснения. Например, при анализе моего логотипа, который, к слову, был придуман с помощью ChatGPT (да, именно ChatGPT создал концепт моего телеграм канала!) Так вот, объяснение Llava мне понравилось больше, лаконичнее что ли...
Бесплатный Llava (рис 1) и ChatGPT-4 v (рис 2)
С другой стороны, при анализе оптической иллюзии, ChatGPT оказался более информативным, раскрыв принципы "амесовой комнаты" или "искаженной комнаты".
Сравнение 2
В этот раз я обоим скормила картинку, не говоря, что это оптическая иллюзия. Я спросила что это, и как такое возможно, Llava начал во всем видеть фотошоп и фотомонтаж:
Тогда я дала подсказку Llava убрать версию с Photoshop и фотомонтажом, но модель снова объяснила это спецеффектом камеры:
Я еще раз спросила как такое возможно в реальности, но Llava была непреклонна:
А ChatGPT просто сказал, что ничем мне помочь не может 🤷🏻♀
Далее я решила дать им обоим подсказку про иллюзию:
В ChatGPT я опять загрузила это изображение и спросила “Как такая иллюзия возможна? Версии с Photoshop и с фотомонтажом не принимаются” - вот тут он наконец мне выдал то, что я хотела:
ChatGPT расписал, что на картинке изображена оптическая иллюзия, которая часто называется "амесовой комнатой" или "искаженной комнатой” и описал принцип иллюзии, чего не скажешь про Llava, которая так конкретизировать не стала:
Вывод:
В итоге у обоих моделей -GPT-4v и Llava есть свои достоинства и недостатки, каждый по своему хорош. Так что Llava достойная бесплатная альтернатива платным функциям ChatGPT. А Dall-E 3 бесплатно (100 генераций в день) есть в Bing на русском, но работает с VPN
Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой тг НейроProfit, там я рассказываю, как использовать нейросети для бизнеса 😉