Анонс Gemini 2.5 Flash Lite: Google шокировал скоростью и ценой!
👋 Привет, кодер и продукт-манагеры!
Пока мы спали Google выкатил Gemini 2.5 Flash Lite
▫️ Ценовой взрыв:
→ $0.10 за 1 млн входных токенов
→ $0.40 за 1 млн выходных токенов
В 18 раз дешевле GPT-4o и в 4 раза Claude 3.5 Haiku!
▫️ Скорость:
• Обрабатывает 240+ страниц текста за менее 0.7 сек
• Работает на спецчипах Google Axion (в 5x быстрее TPU v5)
▫️ Технические детали:
→ Контекстное окно: 128K токенов
→ Поддержка мультимодальности: текст + изображения
→ Оптимизация под edge-устройства (смартфоны, IoT)
🔥 Что это значит для рынка?
• Бизнес с 10 млн запросов/месяц сэкономит $450 000/год в сравнении с GPT-4o
• Прорыв для RAG-систем: мгновенный поиск по гигабайтам данных
• Угроза для Anthropic/Mistral: их тарифы теперь неконкурентны
К концу 2025 года 70% enterprise-решений перейдут на «лайт»-модели благодаря 3 факторам:
1) Стоимость инференса
2) Скорость ответа
3) Энергоэффективность