Самый быстрый Gemini теперь стоит копейки
Представьте: вы платите за ИИ меньше, чем за пачку жвачки на тысячу запросов. Именно это предлагает Google, выпустив модель под названием Gemini 3.1 Flash-Lite.
Цена вопроса - двадцать пять центов за миллион входящих токенов и полтора доллара за исходящие. Для сравнения: крупные модели стоят в разы больше, а тут вам подают производительность буквально за бесценок.
Но дешевизна - это ещё полбеды, потому что модель ещё и летает. По данным бенчмарка Artificial Analysis, скорость генерации выросла на 45% по сравнению с Gemini 2.5 Flash, а первый ответ появляется в два с половиной раза быстрее.
На арене Arenа.аi эта "бюджетная" модель набирает 1432 очка по шкале Elo, показывает 86,9% на тесте GPQA Diamond и 76,8% на MMMU Pro. Это не просто хорошо - это лучше, чем предыдущие полноразмерные флагманы Google.
Что это значит для рынка? Гонка вооружений между OpenAI и Google окончательно превратилась в гонку уценок. Выиграют разработчики, которые теперь могут строить реальные продукты без ипотеки на облачные вычисления. Доступно уже сейчас через Gemini API и Google AI Studio.
Похоже, бюджетные модели перестали быть компромиссом - теперь это просто умный выбор. Похоже, эра "чем дороже, тем лучше" в мире ИИ подходит к концу.

Искусственный интеллект
5.4K пост11.8K подписчиков
Правила сообщества
ВНИМАНИЕ! В сообществе запрещена публикация генеративного контента без детального описания промтов и процесса получения публикуемого результата.
Разрешено:
- Делиться вопросами, мыслями, гипотезами, юмором на эту тему.
- Делиться статьями, понятными большинству аудитории Пикабу.
- Делиться опытом создания моделей машинного обучения.
- Рассказывать, как работает та или иная фиговина в анализе данных.
- Век жить, век учиться.
Запрещено:
I) Невостребованный контент
I.1) Создавать контент, сложный для понимания. Такие посты уйдут в минуса лишь потому, что большинству неинтересно пробрасывать градиенты в каждом тензоре реккурентной сетки с AdaGrad оптимизатором.
I.2) Создавать контент на "олбанском языке" / нарочно игнорируя правила РЯ даже в шутку. Это ведет к нечитаемости контента.
I.3) Добавлять посты, которые содержат лишь генеративный контент или нейросетевой Арт без какой-то дополнительной полезной или интересной информации по теме, без промтов или описания методик создания и т.д.
II) Нетематический контент
II.1) Создавать контент, несвязанный с Data Science, математикой, программированием.
II.2) Создавать контент, входящий в противоречие существующей базе теорем математики. Например, "Земля плоская" или "Любое действительное число представимо в виде дроби двух целых".
II.3) Создавать контент, входящий в противоречие с правилами Пикабу.
III) Непотребный контент
III.1) Эротика, порнография (даже с NSFW).
III.2) Жесть.
За нарушение I - предупреждение
За нарушение II - предупреждение и перемещение поста в общую ленту
За нарушение III - бан