Только что стартовало Google I/O – главное ИИ-мероприятие компании. Крупные анонсы уже отгремели, будем разбирать.
Gemini 3.5 Flash
Google сменила порядок выхода моделей: если раньше первой в поколении шла Pro-версия, то теперь стартовали с Gemini 3.5 Flash, а Gemini 3.5 Pro тестируется внутри компании и ожидается в течение месяца.
По бенчмаркам выглядит хорошо, местами обходя Gemini 3.1 Pro, GPT-5.5 и Opus 4.7. Лидирует в агентских задачах и работе с инструментами: на MCP Atlas (многошаговые сценарии с внешними инструментами) – 83,6%, выше всех в таблице. На Finance Agent v2 – 57,9% против ~51% у обоих конкурентов и всего 43% у собственного флагмана 3.1 Pro. Сильна и в мультимодальности: 83,6% на MMMU-Pro и 84,2% на CharXiv – тоже лучшие результаты.
В кодинге Flash обгоняет 3.1 Pro (76,2% против 70,3% на Terminal-Bench 2.1), но фронтир пока не берет – на том же тесте GPT-5.5 выдает 78,2%, а на SWE-Bench Pro Opus 4.7 уходит вперед с 64,3% против 55,1% у Flash.
А вот где отставание – глубокое рассуждение и длинный контекст. На Humanity's Last Exam (академический тест) Flash набирает 40,2% – меньше, чем ее собственная 3.1 Pro (44,4%) и Opus 4.7 (46,9%). На головоломках ARC-AGI-2 – 72,1% против 77,1% у 3.1 Pro. На GDPval-AA (Elo-рейтинг на экономически ценной работе) у Flash 1656 – ниже Sonnet 4.6 (1676), Opus 4.7 (1753) и GPT-5.5 (1769). На длинном контексте MRCR (128k) — 77,3% против 84,9% у 3.1 Pro.
Модель раскатывают во всех основных приложениях Google, в том числе на бесплатном плане. Отличная новость – теперь можно получить чат-бота frontier-уровня, не заплатив ни копейки.
Но надо тестировать. Я так и не смог пользоваться Gemini 3 Pro/Flash: у модели были сильные стороны (отличный русский, мало цензурирована, хорошее компьютерное зрение), но в недостатках – высокий уровень галлюцинаций и плохой веб-поиск. Жду, пока появится на моей подписке.
Antigravity 2.0
Google долгое время экспериментировала с кучей ИИ-агентов для кодинга – Gemini CLI, Jules, AI Studio, Antigravity – устроив путаницу на фоне тех же Claude Code и Codex. Теперь основная площадка выбрана – на I/O всё внимание уделили новой Antigravity 2.0.
Под маркой Antigravity компания собрала основные варианты взаимодействия: десктоп-клиент, CLI для тех, кто работает через терминал, SDK для желающих настраивать агентов самостоятельно. Работает на Gemini 3.5 Flash, причем по бенчмаркам видно, что модель натаскивали под Antigravity – первые места она берет именно в агентских сценариях.
Antigravity 2.0 позволяет запускать агентов параллельно и делить между ними задачи в большом проекте, есть автоматизация по расписанию, плюс Gemini 3.5 Flash выдает потрясающую скорость – по замерам, в четыре раза больше Opus 4.7. Google похвасталась, что накодила за 12 часов с помощью Antigravity 2.0 полностью работающую операционную систему, но где ее пощупать, так и не сказала.
Gemini Omni Flash
Первый прототип “модели мира”, который Google открывает для широких пользователей. По словам Демиса Хассабиса, новая модель создания видео сочетает визуальные возможности генеративных моделей вроде Veo 3 и Nano Banana 2 с интеллектом языковых моделей.
Промпт, который вы напечатали или наговорили, сначала попадает в в специальную версию Gemini 3.1 Pro, которая дополнительно обрабатывает его и передает в генеративную модель. Считается, что так ИИ будет лучше понимать физику и происходящее в кадре. Готовое видео можно редактировать – голосом или текстовым промптом.
Omni также с сегодняшнего дня выходит для всех платных подписчиков Gemini.
А вот ОС за 12 часов я пока не собрал, врать не буду. Но как выжимать из этих моделей максимум на реальных задачах – разбираю по-честному на Бусти.