Сравнение ChatGPT и Llava: кто лучше распознает изображения?
Не так давно, на сцену вышел ChatGPT-4v с возможностью распознавания изображений. Но на рынке есть и бесплатный аналог Llava, который также предлагает ряд уникальных функций. И, кстати, работает без VPN.
Желаете попробовать Llava прямо в браузере? Кликните здесь.
Если вы захотите установить его локально, воспользуйтесь этой ссылкой.
Почему Llava?
Этот инструмент распознает изображения, решает капчи и создает код на основе скриншотов. Преимущества Llava перед ChatGPT заключаются в том, что она бесплатна и работает без VPN. Русский язык понимают оба
Сравнение 1
Мои собственные эксперименты показали, что Llava может дать более лаконичные объяснения. Например, при анализе моего логотипа, который, к слову, был придуман с помощью ChatGPT (да, именно ChatGPT создал концепт моего телеграм канала!) Так вот, объяснение Llava мне понравилось больше, лаконичнее что ли...


Бесплатный Llava (рис 1) и ChatGPT-4 v (рис 2)
С другой стороны, при анализе оптической иллюзии, ChatGPT оказался более информативным, раскрыв принципы "амесовой комнаты" или "искаженной комнаты".
Сравнение 2
В этот раз я обоим скормила картинку, не говоря, что это оптическая иллюзия. Я спросила что это, и как такое возможно, Llava начал во всем видеть фотошоп и фотомонтаж:
Тогда я дала подсказку Llava убрать версию с Photoshop и фотомонтажом, но модель снова объяснила это спецеффектом камеры:
Я еще раз спросила как такое возможно в реальности, но Llava была непреклонна:
А ChatGPT просто сказал, что ничем мне помочь не может 🤷🏻♀
Далее я решила дать им обоим подсказку про иллюзию:
В ChatGPT я опять загрузила это изображение и спросила “Как такая иллюзия возможна? Версии с Photoshop и с фотомонтажом не принимаются” - вот тут он наконец мне выдал то, что я хотела:
ChatGPT расписал, что на картинке изображена оптическая иллюзия, которая часто называется "амесовой комнатой" или "искаженной комнатой” и описал принцип иллюзии, чего не скажешь про Llava, которая так конкретизировать не стала:
Вывод:
В итоге у обоих моделей -GPT-4v и Llava есть свои достоинства и недостатки, каждый по своему хорош. Так что Llava достойная бесплатная альтернатива платным функциям ChatGPT. А Dall-E 3 бесплатно (100 генераций в день) есть в Bing на русском, но работает с VPN
Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой тг НейроProfit, там я рассказываю, как использовать нейросети для бизнеса 😉
Куликовская битва
Было это примерно в середине 1990-х. Лужков Юрий Михалыч уже закрыл все подъезды стальными дверями с кодовыми замками. А мобильников еще не было в широком употреблении. Вот. И одна девочка пригласила меня к себе. Жила она где-то в дальнем районе. И сказала: "У нас недавно в подъезде поставили кодовый замок. Код запомнить легко - тринадцать-восемьдесят, даже записывать не надо". Я спрашиваю: "А почему?" Она говорит: "Ты что! это же Куликовская битва! 1380-й год!" Ах, ну да, конечно, какой я тупой... Вот. Ну, я очень волнуюсь перед свиданием. Мне лет двадцать было. Побрился-оделся-надушился, купил цветы, вино и торт - и когда приехал - а там от метро еще на автобусе пяток остановок - в общем, дошел до ее дома и вспомнил, что намертво забыл год, когда Дмитрий Донской ввалил Мамаю...
И вот представь себе: вечер, ветер дует, народу на улице раз-два и обчелся, темнеет - и вот по этому пейзажу мечется дурак с букетом, тортом и бутылкой в кармане плаща, подбегает к случайным прохожим и спрашивает:
- Простите, а в каком году была Куликовская битва?"
Ну хорошо.
Посмеялись.
А чем дело-то кончилось? Хоть кто-то из прохожих помнил год Куликовской битвы? Мальчик попал к девочке или нет?
Тут своя история.
Бедный мой друг метался по микрорайону, пугая старушек, которые были похожи на учительниц, и дяденек инженерского обличья. Но никто не знал родной истории!
Отчаявшись, он вдруг увидел паренька пэтэушного вида.
Подошел, нарочно наглым и даже приблатнённым голосом спросил: "Зёма, курить есть?" Тот дал ему сигарету. Он прикурил, затянулся, сплюнул и сказал:
- Тут бля на спор спросили, когда была эта, ну типа Куликовская разборка?
- Один три восемь ноль! - сказал парень. - К Ленке, что ли, идешь?
Телеграм - Интересно
Бесплатный аналог Code Interpreter в ChatGPT, работающий локально
Полезная нейросеть для программистов Open Interpreter — бесплатный аналог Code Interpreter в ChatGPT. Позволяет LLM выполнять код (Python, Javascript, Shell и др.) локально. Вы можете общаться с Open Interpreter через ChatGPT - подобный интерфейс в терминале. Достаточно установить, и можно творить, что душа пожелает с помощью промптов.
Что может еще:
🟡 создавать и редактировать фотографии, видео, PDF-файлов и т.д.
🟡 проводить исследования
🟡 строить, очищать и анализировать большие массивы данных
Иными словами, бесплатный ChatGPT Code Interpreter на вашем компьютере. Кстати, Список промптов к Code Interpreter подойдет и к Open Interpreter.
Ранее я рассказывала про аналоги Code Interpreter, которые не нужно устанавливать:
🟡 про Claude-2
🟡 про Perplexity - появилась возможность загружать свои документы
А просто пообщаться и проанализировать документы можно с этими сервисами:
Больше полезных сервисов для работы, учебы и облегчения жизни в моем телеграм канале НейроProfit , в котором я рассказываю, как можно использовать нейросети для бизнеса
Конвертация дизайна из Фигмы в рабочий код на HTML + CSS + React
Достаточно сбросить дизайн в Kombai и получить готовый код ✅
Разработчики могут бесплатно использовать Kombai во время предварительных исследований
Бесплатно можно получить:
➕ Неограниченное количество загрузок дизайна
➕ Неограниченное количество загрузок кода
➕ React и HTML + CSS
➕ Tailwind CSS и MUI Base (для компонентов форм)
➖ Но обменяться файлами дизайна с третьми лицами не получится 🤷🏻♀️
Для доступа к расширенному функционалу, а именно, - интеграция и настройка, пользовательские переменные CSS и миксины, библиотеки пользовательских компонентов, вывод кода в соответствии с технологическим стеком и премиум поддержка, - необходимо связываться с разработчиками Kombai
Больше полезных сервисов для работы и учебы в моем телеграмм канале (ссылка в описании профиля), там я рассказываю, как можно использовать нейросети для бизнеса











