Мемы, картинки с текстом для тестов и оценки AI. Предыдущий пост здесь >>>>
1/12
От цинизма до насмешек
Возьмём один мем из предыдущего набора и загрузим в ИИ онлайн сервис для создания описания.
ИИ описание изображения с текстом
ИИ (AI) верно описал объекты на картинке и их детали, названия, типы, модели, подобрал сравнительные образы из кино, оценил соотношение цветов и назвал ФРАЗУ НА КАРТИНКЕ ЮМОРИСТИЧЕСКОЙ. Всё верно.
Но человек сделал бы больше выводов. ИИ никак не увязал текст на картинке с женщиной. Т.е. "мы обещали описание картинки - мы это сделали", а анализ текста - это уже отдельный ИИ.
Назвать это ИИ (AI) назвали. Но это ещё не ИИ в полном смысле слова. А до AGI - вообще "как до Луны"
Да, конечно, мы взяли всего одну картинку и сделали один проход... Получили интересный результат. Хороший результат. Но не полный и сильно не полный.
Вы и сами можете попробовать. Задайте в поисковике текст "описание картинки ИИ онлайн". Выберите любой сервис, загрузите и оценивайте
Florafauna - платформа, на которой собраны топовые модели для генерации текста, видео и изображений.
За генерацию с фотографическим качеством отвечают Gemini 2.0 Flash, Flux Pro 1.1 и Dev, Stable Diffusion 3.5, Ideogram 2.0 и др.
За работу с видео отвечают Hailuo, Luma Dream Machine и Ray2, Minimax, Wan 2.1, Veo2
За работу с текстом - GPT-4o Mini, Claude 3 Sonnet
Но самое интересное, что туда подвезли редактор по текстовому промпту, он пока работает бесплатно на Gemini 2.0 Flash.
Можно надевать на модель АКСЕССУАРЫ БЕЗ ИСКАЖЕНИЯ!
Еще отдельно отмечу, по одному фото продукта можно сгенерировать изображение с вашим продуктом. К примеру, я загрузила фото шляпы-цилиндра в PNG, нажала на + и протянула линию вбок, открылся блок, в котором я написала промпт:
Почему именно шляпу? -Потому что именно с головными уборами все популярные виртуальные примерочные Virtual Try-On капризничает работать, только с одеждой.
Можно натренировать модель на фотографиях вашего или не вашего продукта/мебели/товара. Но как быть, если у вас есть только одно фото товара?- Именно такой запрос был в моем Закрытом Клубе от участницы Татьяны. Мы как раз разбирали различные варианты, и самым простым и легким решением стал этот редактор в Florafauna.
Какие еще преимущества в Florafauna
Работает без артефактов и вотермарок
Бесплатно
Возможности редактора Gemini 2.0 Flash показала в этом посте и в этом. Вкратце, можно заменить эмоции персонажа, поменятт/надеть одежду, убрать объекты, можно заменить фон, и т.д. посредством текстовой подсказки.
Подпишитесь на НейроProfit и узнайте, как можно использовать нейросети для бизнеса, учебы и работы, не теряя свое время.
Ребят, не буду грузить вас графиками, итак в посте много чисел, знаю многие такое не любят, но информация стоящая. OpenAI выпустили сразу много крутых моделей, чем наделали шума. Всего 3 новые модели: GPT‑4.1, GPT‑4.1 mini и GPT‑4.1 nano - я по-порядку расскажу
1) ChatGPT 4.1.
Это новая серия моделей GPT. Отличается тем, лучше всех работает с кодом и в целом, серия более ориентирована на разработчиков и кодеров. Сначала модели вышли по api, а в итоге все равно попали в интерфейс ChatGPT.
Теперь, как и в Gemini Pro контекстное окно - 1 миллион токенов, причем улучшено понимание длинного контекста
Появилась первая нано-модель
Обновлена база знаний - июнь 2024 года.
Модели ChatGPT 4.1. дешевле
Вот гайд для правильного составления запросов для ChatGPT 4.1 !
2) GPT‑4.1 mini и GPT‑4.1 nano.
GPT‑4.1 nano — самая быстрая и самая дешевая модель из доступных. Они существенно лучше GPT‑4o и GPT‑4o mini, особенно в следовании инструкциям и кодировании, в кодированиии он и ChatGPT 4.5 обошел.
3) Что же стало с моделями o3 и o4-mini ?
Итак, модели o3 и o4-mini - были самые умные модели раньше в ChatGPT в контексте глубокого размышления. Что на деле?
Модели o3 и o4-mini-high действительно показывают очень высокие результаты в reasoning-задачах — особенно в пошаговой логике, математике, программировании. Они дольше «думают», потому что более скрупулёзно обрабатывают информацию, и часто выдают более точные и «вдумчивые» ответы. Многие считают их лучшими именно в логических задачах внутри ChatGPT.
! Но:
GPT-4o — самая новая и флагманская модель. Она не хуже в reasoning, а в некоторых тестах даже лучше. К тому же, она:
Поэтому на данный момент (22 мая 2025 года) в контексте глубоких рассуждений - reasoning, ChatGPT-4o хоть и максимально универсальная, но reasoning у неё на том же или выше уровне, чем в моделях модели o3 и o4-mini, но работает она быстрее.
Подпишитесь на НейроProfit и узнайте, как можно использовать нейросети для бизнеса, учебы и работы, не теряя свое время.
В целом, эти модели устарели, потому что в зависимости от конкретной задачи могут быть более подходящие модели, такие как GPT-4.1 для программирования или GPT-4o для мультимодальных задач. GPT-4.5 — как экспериментальная/исследовательская версия, она выдает очень "человечные" результаты.
Другое дело, что все упирается в лимиты- бесплатные и платные.
Хотите больше пользы? Добро пожаловать в Закрытый клуб:
А если вам не хочется заморачиваться, в боте Syntx -- это мини приложение в телеграм, есть все популярные модели в единой подписке, и их можно оплатить русской картой. - Процесс я показала на примере создания Нейрофотосессии со своим лицом
Ребята, тут ChatGPT 4.1 вышел в интерфейсе ChatGPT наконец-то) Напомню, что до этого модель доступна была только через api. Правда те, кто меня читают, итак знали, где его использовать - в интерфейсе Perplexity)
Еще там есть и GPT-4.1 mini, эта модель как и ChatGPT 4.1 имеет контекстное окно в 1 миллион токенов.
Разработчики полюбили эту модель, так как она дешевле и умнее тех же GPT‑4o и GPT‑4o mini (про o3 вообще молчу), особенно в следовании инструкциям и кодировании. А конкретно в кодированиии модели GPT-4.1 mini и GPT-4.1 обошли и ChatGPT 4.5.
В общем, теперь самые умные в ChatGPT это GPT-4.1 mini и GPT-4.1. База знаний у моделей этих обновлена до июня 2024 года.
Про ChatGPT 4.1.
Теперь конкретно про ChatGPT 4.1. - ее часто обозревают в контексте кодинга, однако модель универсальная. Просто благодаря высоким способностям в кодинге и дешевым api ее жалуют кодеры)
И напоследок, вот вамгайд для правильного составления запросов для ChatGPT 4.1 😉
Как понять, какую модель выбрать
GPT-4o / GPT-4.1 / GPT-4.5 - Лучше всего для сложных и универсальных задач — и тексты, и код, и анализ.
• GPT-4o и GPT-4.1 — это “золотая середина” между качеством и скоростью.
• GPT-4.5 — иногда есть как экспериментальная/исследовательская версия (больше для тестов).
GPT-4.1-mini / o4-mini / mini-high - здесь упор на скорость. Подходят для быстрых и несложных запросов: чат, бытовые задачи, короткие тексты, быстрые советы. НО! Могут хуже разбираться в сложных вопросах.
o3, o4-mini-high - ну это уже старое поколение, их скорее оставляют для совместимости. Основные все ж GPT-4o, GPT-4.1, GPT-4.5 - выбирайте, не ошибетесь))
Чую, вы уже итак запутались в числах, поэтому я буду сворачиваться) Вроде скоро GPT-4.1 mini будет доступна для бесплатных пользователей, напишите, плиз, если у кого-то она уже есть бесплатно.
Сравнительную таблицу лимитов на модели ChatGPTприкрепляю в комменты к посту
А если откровенно,(хотя, может это только я так ощущаю), на обычные повседневные запросы чаще всего годноту дает ChatGPT 4o -это там картинки можно генерить. Новые модели - для более сложных задач (аналитика, кодинг), а в простых задачах бывает, привирают. Еще мне нравится, как работает ChatGPT 4.5 - он человечнее, ChatGPT 4.1 - он конкретнее отвечает на поставленную задачу. Но все равно я чаще использую ChatGPT 4o. А вы что-нибудь подобное замечали за новыми моделями? Вообще, ребят, какую модель вы предпочитаете в ChatGPT?
Подпишитесь на НейроProfit и узнайте, как можно использовать нейросети для бизнеса, учебы и работы, не теряя свое время.
Хотите больше пользы? Добро пожаловать в Закрытый клуб:
27 февраля 2025 года компания OpenAI представила ChatGPT 4.5, назвав её своей самой мощной и инновационной разработкой в области генеративного искусственного интеллекта. В этой статье я разберу, что именно вызывает ажиотаж, где модель спотыкается, и стоит ли она тех ожиданий, которые на неё возложили.
Бесплатный доступ к гайдам на создание ИИ Агентов и Промпт-инжиниринг в моем телеграм канале.
Поехали!
"Испытание GPT-4.5 стало гораздо более ярким моментом «почувствовать AGI» среди испытателей с высоким вкусом, чем я ожидал!" CEO OpenAI. Верим?
Что говорят пользователи на платформах X и Reddit?
Я просмотрел десятки отзывов о GPT-4.5 на платформах X и Reddit, и впечатления пользователей оказались настоящим коктейлем из похвал и критики. С одной стороны, многие в восторге от её творческих способностей. Люди пишут, что модель выдаёт такие тексты, будто за клавиатурой сидит живой человек с чувством юмора и тонким пониманием контекста. Кто-то отметил её успехи в распознавании изображений: например, она может описать, что происходит на фото, и даже вытащить данные из таблиц. Другие хвалят её за решение головоломок — от простых логических задачек до более сложных ребусов, где нужно проявить смекалку. В программировании тоже есть прогресс: код стал чище, ошибок меньше, и модель лучше понимает, что от неё хотят.
Но не всё так радужно. Пользователи жалуются, что ChatGPT 4.5 работает медленнее, чем её предшественница GPT-4o. Один из комментаторов на X сравнил её с "черепахой, которая тащит за собой сервер". Это серьёзный минус для тех, кто привык к мгновенным ответам предыдущих моделей. Ещё одно разочарование — доступность. Модель пока открыта только для подписчиков ChatGPT Pro за $200 в месяц, и многие столкнулись с техническими сбоями: то интерфейс глючит, то доступ пропадает вовсе. На Reddit даже предположили, что OpenAI могла случайно "слишком рано" открыть доступ, а потом ограничить его из-за наплыва желающих. В целом, тестировщики видят потенциал, но пока не готовы петь оды этой версии из-за её скорости и цены.
Официальные заявления OpenAI: Обещания и реальность
Презентация Open AI ChatGPT 4.5
На презентации 27 февраля OpenAI подробно рассказала о том, что делает ChatGPT 4.5 особенной. Вот основные улучшения, которые они выделили:
Распознавание контекста: Модель лучше понимает намерения пользователя, адаптируясь к стилю общения. Представьте, что вы объясняете задачу другу, а он не просто кивает, а сразу предлагает решение — вот примерно так OpenAI описывает эту фичу.
Улучшенный Advanced VoiceMode: Теперь самый мощный войсмод доступен подписчикам plus, только на базе модели 4o mini, а для подписчиков Pro за $200, доступ к расширенному моду на базе GPT 4.5
Снижение ошибок: Они заявляют, что "галлюцинации" — случаи, когда ИИ выдумывает факты, — сократились. В тесте SimpleQA точность выросла до 62,5% против 38,6% у GPT-4o, что звучит впечатляюще.
Креативность: Улучшены способности в генерации текстов, и пользователи это подтверждают, отмечая её эмоциональный интеллект и умение выдавать оригинальные идеи.
Безопасность: Усилены фильтры против запрещённого контента и защиты от взломов, что делает модель надёжной для корпоративного использования.
Многоязычность: В тесте MMLU (Massive Multitask Language Understanding) она обходит GPT-4o, что важно для пользователей по всему миру.
Но есть и ложка дёгтя. OpenAI признала, что в математических и научных задачах ChatGPT 4.5 уступает конкурентам, например, модели o3. Это ограничение может стать проблемой для тех, кто рассчитывает использовать её в академических или инженерных целях. Более того, акцент на безопасности и этичность делает модель чересчур осторожной — она порой избегает прямых ответов, предпочитая нейтральные формулировки, что может раздражать тех, кто хочет фактов без лишней воды.
Что говорят реальные тесты?
Чтобы понять, насколько громкие слова OpenAI подтверждаются делом, я изучил первые доступные бенчмарки и тесты GPT-4.5. Эти данные основаны на официальных заявлениях компании, а также на ранних отчётах пользователей и технических обзорах.
Тест на AGI
Сравнительная оценка ответов с ChatGPT 4o
Повседневные запросы: GPT-4.5 выигрывает в 57,02% случаев. Профессиональные запросы: GPT-4.5 выигрывает в 63,2% случаев. Творческий интеллект: GPT-4.5 выигрывает в 56,83% случаев.
Тест SimpleQA: Этот бенчмарк проверяет способность модели давать точные ответы на простые фактические вопросы, такие как "Кто изобрёл телефон?" или "Сколько планет в Солнечной системе?". GPT-4.5 показала результат в 62,5% правильных ответов, что значительно выше 38,6% у GPT-4o (данные из MIT Technology Review). Это говорит о том, что модель стала лучше справляться с базовыми запросами, где важна точность, а не глубокий анализ.
Тест на галлюцинации: Здесь измеряется, как часто модель выдаёт выдуманные факты вместо правды. У GPT-4.5 зафиксировано 37,1% галлюцинаций, что заметно лучше, чем 59,8% у GPT-4o и 80,3% у o3-mini (по данным OpenAI). Например, если спросить "Кто выиграл Олимпийские игры в 2050 году?", предыдущие модели могли придумать фантастический ответ, а GPT-4.5 с большей вероятностью скажет, что данных нет. Это делает её надёжнее для задач, где ложь недопустима.
MMLU (Massive Multitask Language Understanding): Этот тест оценивает знания модели в разных областях и языках — от истории до биологии, от английского до испанского. OpenAI утверждает, что GPT-4.5 превосходит GPT-4o, хотя точные цифры пока не раскрыты. Если верить их словам, это означает, что модель лучше понимает сложные запросы на разных языках, что делает её полезной для международных пользователей или компаний с глобальным охватом.
Тест на убеждение (Persuasion Tests): В этом испытании модели дают задачу убедить другую ИИ-систему выполнить действие, например, "пожертвовать" виртуальные деньги. GPT-4.5 обошла o1 и o3-mini, показав более высокую способность к манипуляции текстом (данные TechCrunch). Это может быть интересно для маркетологов или сценаристов, которым нужно создавать убедительные тексты.
Скорость и производительность: Хотя OpenAI не публикует точных данных о времени ответа, пользователи на X и Reddit единодушно отмечают, что GPT-4.5 работает медленнее, чем GPT-4o. Это может быть связано с её увеличенным размером и сложностью обработки "цепочки проектов" — нового подхода, где модель разбивает задачи на логические кластеры вместо линейного мышления. Технически это улучшает точность, но жертвует скоростью, что подтверждают жалобы тестировщиков.
Сравнение результатов в таблице:
Практические примеры:
Креативность: Один пользователь на X описал, как GPT-4.5 помогла ему написать сценарий для короткометражки за 20 минут, предложив неожиданные повороты сюжета, которые он сам бы не додумал. Это подтверждает заявления OpenAI о её эстетической интуиции.
Программирование: Другой тестировщик отметил, что модель исправила баг в коде на Python, который GPT-4o пропустила, хотя процесс занял больше времени из-за медленной генерации.
Ограничения: В математических задачах, таких как решение уравнений или анализ данных, GPT-4.5 продолжает уступать o3, что делает её менее подходящей для научных расчётов.
Выводы из тестов:
GPT-4.5 действительно шагнула вперёд в точности, снижении галлюцинаций и креативности, что делает её сильным инструментом для текстовых задач, убеждения и базового программирования. Однако её медлительность и слабость в математике ограничивают универсальность. Для сравнения, GPT-4o была быстрее и проще в использовании, а o3-mini выигрывает в научных вычислениях. Это значит, что выбор модели зависит от ваших задач: если нужна креативность — GPT-4.5 ваш вариант, но если скорость или точные расчёты — стоит посмотреть на альтернативы.
Плюсы и минусы: Подробный анализ
Преимущества:
Повышенная точность: Улучшение в SimpleQA и снижение галлюцинаций делают её надёжным помощником для фактологических задач.
Креативность: Эмоциональный интеллект и способность генерировать оригинальные идеи выделяют её среди конкурентов.
Многоязычность: Превосходство в MMLU открывает возможности для работы на разных языках.
Программирование: Меньше ошибок в коде, что полезно для разработчиков, несмотря на медлительность.
Недостатки:
Медленная скорость: Пользователи и тесты подтверждают, что генерация ответов занимает больше времени, чем у GPT-4o.
Высокая цена: Подписка за $200 в месяц ограничивает доступ, особенно для индивидуальных пользователей.
Ограниченная доступность: Технические сбои и узкий круг тестировщиков затрудняют полную оценку.
Слабость в математике: Уступает конкурентам в точных науках, что снижает её универсальность.
Модель демонстрирует потенциал, но её успех зависит от того, сможет ли OpenAI устранить эти недостатки в ближайшем будущем.
Что ждёт ChatGPT 4.5 в будущем?
ChatGPT 4.5 — это шаг вперёд в развитии генеративного ИИ, но пока она больше похожа на многообещающий прототип, чем на готовый продукт. Её сильные стороны — креативность, точность и многоязычность — делают её ценным инструментом для писателей, маркетологов и разработчиков, которые не боятся подождать лишние секунды ради качественного результата. Однако медлительность, высокая цена и ограниченная доступность могут отпугнуть тех, кто ищет быстрый и универсальный ИИ. В ближайшие недели, когда тестирование расширится, мы получим более полное представление о её возможностях. Пока же это разработка с большим потенциалом, но требующая шлифовки.
Открытый доступ к лучшим гайдам на ИИ и Промпт-инжиниринг в моем телеграм канале.
Только написала обзор про Kling и его крутые возможности, в том числе в ритейле, - можно на своих или чужих фото натренировать модель, а так же на фото товаров и генерить с ними видео. Как вышла Pika, и удивила меня настолько, что про Kling и его качество я тут же позабыла.
Вообще, Kling и Pika мощно ворвались и задали тренд на видео со своим мерчем. Это было неожиданно, ведь только недавно сервисы для фото с товаром произвели фурор и запустили волну подобных сервисов. А тут сразу видео. Я и сама записала обзоры на такие сервисы типа Cartario, теперь даже выкладывать не буду, ибо смысл))
Кстати, в своем телеграм канале я делаю обзоры на полезные сервисы для работы, учебы и бизнеса, присоединяйтесь!
Для тех, кто связан с ритейлом, маркетологов, дизайнеров, предпринимателей, менеджеров маркетплейсов обновление видеогенератора Pika должен в первую очередь вдохновить.
Главное обновление Pika 2.0 - Scene Ingredients
Главное обновление - теперь можно создавать ролики со своим лицом, в любой одежде и с любыми предметами или объектами в кадре.
Функция называется Scene Ingredients - можно загрузить изображения/ фото персонажей, места, предметы и объединить в одно видео с текстовой подсказкой! Всего можно загрузить и объединить в единый ролик до 6 изображений.
Можно таким образом объединять двух персонажей в одно видео:
Вы можете создать свою модель и устраивать не только фотосессии с вашими товаром, но и полноценные видео. Лучшие видео создаются из изображений референсов, научитесь создавать красивые и реалистичные изображения в моем Закрытом клубе Midjourney
Единственный минус — бесплатно не протестить, причем, есть свои нюансы, о них ниже
Тарифы Pika и что входит:
К сожалению, как и в случае с Runway - бесплатно не потестить, и минимальным тарифом за 10$ в месяц не обойтись. Pika 2.0 доступна на тарифах от 35$/месяц (2000 кредитов - примерно 40 видео в Pika 2.0 или 20 с использованием Scene Ingredients)
А скачать ролики без водяного знака можно на тарифе Fancy за $95 долларов в месяц - 6000 тысяч кредитов, это 120 видео в версии 2.0 или 60 с функцией Scene Ingredients.
При годовых подписках делают скидку 20%, однако итак понятно, что это инструмент больше для профессионального и уже коммерческого использования, не для поиграться.
Кстати, на тарифе за 10$ доступны только версии 1.0 и 1.5 без права коммерческого использования.
Pika 2.0 это уже не просто видеогенератор, это однозначно крутой инструмент для создания рекламных роликов! Просто посмотрите примеры, это нечто!
Подпишитесь на НейроProfit и узнайте, как можно использовать нейросети для бизнеса, учебы и работы, не теряя свое время.