За одну неделю апреля 2026 года в индустрию упали сразу три релиза: 16 апреля вышел Claude Opus 4.7, 20 апреля Moonshot выкатил Kimi K2.6, а 23 апреля OpenAI показал GPT-5.5. Большинство выбрало одну модель и спокойно поехало дальше. Это и есть главная ошибка года.
Те, кто реально выжимает максимум из новой волны ИИ, не лояльны ни одному вендору. Они роутят каждую задачу в ту модель, которая делает её лучше и дешевле всех остальных. Один человек с такой связкой закрывает объём работы, на который раньше уходила команда из четырёх специалистов. Один промпт способен запустить 300 параллельных агентов, выполняющих 4000 скоординированных шагов. Неделя на настройку, и привычный workflow меняется навсегда.
Сначала холодная математика. Один сольный инженер, который тратит 15 миллионов токенов API в месяц, при работе только на Claude Opus 4.7 платит около 495 долларов. На GPT-5.5 это уже примерно 165 долларов. А если умно роутить и отдавать массовые задачи Kimi K2.6, счёт уезжает ниже 60 долларов. Разница в десять раз без потери качества там, где это важно.
Kimi K2.6 от Moonshot AI вышел 20 апреля под Modified MIT License, открытый и дешёвый. Цена в районе 0,60 до 0,95 доллара за миллион входных токенов, это примерно в 8 раз дешевле Claude и в 5 раз дешевле GPT-5.5 на одинаковой работе. Под капотом 1 триллион параметров суммарно, 32 миллиарда активных на токен, контекст 256k и максимальный ответ до 65 536 токенов за один проход, что больше, чем у флагманов OpenAI и Anthropic. Модель нативно обучена координировать 300 субагентов и 4000 шагов на длинных задачах.
В реальном тесте K2.6 за 13 часов автономно перекроил восьмилетний движок финансового матчинга, прошёл 12 стратегий оптимизации, сделал больше 1000 вызовов инструментов, поправил больше 4000 строк кода и вытащил прирост медианной пропускной способности на 185% и общей производительности на 133%. Внутри Moonshot одна команда пять суток подряд держала его как автономного агента: мониторинг, реакция на инциденты, эксплуатация, всё без человека.
По бенчмаркам K2.6 берёт 80,2% на SWE-bench Verified, 58,6% на SWE-bench Pro вровень с GPT-5.5, 92,5% на DeepSearchQA и 66,7% на Terminal-Bench 2.0. Уровень галлюцинаций упал с 65% у K2.5 до 39%, что близко к Claude Opus 4.7 с его 36%. Слабые места честно признаны: нет ввода картинок через API, чуть выше retry на схемах инструментов и не лидер в чистой математике.
Claude Opus 4.7 вышел 16 апреля и остаётся лучшей моделью под продакшн-код, юридические и корпоративные документы, vision и любые задачи, где точность важнее скорости. На SWE-bench Pro он лидирует с 64,3%, обгоняя Kimi и GPT-5.5 примерно на 6 пунктов. Визуальная точность подскочила с 54,5% до 98,5% после апгрейда разрешения с 1,15 до 3,75 мегапикселя. Модель сама верифицирует свои ответы перед тем, как их отдать.
GPT-5.5 от OpenAI выкатили 23 апреля, и это сильнейшая модель под математику, веб-ресёрч с её 90,1% на BrowseComp и под computer use, где она автономно ведёт реальные GUI с 78,7% на OSWorld-Verified. На длинном контексте GPT-5.5 уезжает на 74,0% против 32,2% у Claude. На бумаге она дорогая, 5 и 30 долларов за миллион токенов, но за счёт меньшего числа выходных токенов на ту же задачу выходит дешевле, чем кажется.
Главное, чего не делает никто, кроме Kimi, это рой агентов. K2.6 параллельно поднимает до 300 субагентов на 4000 скоординированных шагов, втрое больше, чем у K2.5. Каждый агент тащит свой кусок задачи, координатор сводит результаты, и вы получаете сквозной выход из одного промпта. На запуске показали кейс, где 100 агентов сравнили одно резюме со 100 вакансиями и выдали 100 кастомизированных версий CV. В другом прогоне астрофизическая статья превратилась в 40-страничный материал на 7000 слов с датасетом на 20 000 строк и 14 графиками.
Сам чит-код звучит просто. Bulk-кодинг, фронт по описанию или скрину, рои агентов на большой ресёрч и ночные автономные прогоны отдаём Kimi K2.6. Это рабочий конь и ночной воркер. Claude Opus 4.7 берёт продакшн-код, юридические документы, корпоративные процессы, vision и всё, где ошибка стоит реальных денег. GPT-5.5 уходит на математику, веб-ресёрч и computer use. Решение о роутинге занимает пять секунд, а экономия фиксируется навсегда.
Репозитории, ради которых стоит попробовать всё это руками. github.com/moonshotai/Kimi-K2 это официальный репозиторий с весами, гайдами под vLLM и SGLang и документацией API. github.com/musistudio/claude-code-router сшивает всё в один интерфейс с автоматическим роутингом в Kimi, GPT-5.5 или любую другую модель через OpenRouter. github.com/CheswickDEV/claude-opus-4.7-prompt-optimiz... это мета-промпт под Opus 4.7 и его новый xhigh effort режим. github.com/openai/gpt-5-coding-examples это демо от OpenAI, собранные одним промптом, каждое с опубликованным исходным промптом.
Что реально можно сделать уже сегодня. Собрать целый SaaS-продукт за одну сессию: описать продукт Kimi, получить каркас фронта, бэка и DevOps-конфигов, потом отдать критические пути в Opus 4.7 на закалку. Сделать ресёрч любого уровня глубины, подняв 50 до 100 агентов на одном вопросе и собрав структурированный отчёт со ссылками. Автоматизировать мониторинг: пусть Kimi как фоновый агент смотрит в логи и пайплайны деплоя, при поломке находит релевантные коммиты и кидает черновик фикса в Slack.
Главный вывод простой. Эпоха одной любимой модели закончилась примерно 23 апреля 2026 года. Выигрывает не тот, у кого подписка дороже, а тот, кто умеет роутить задачи и собирать связку из открытой Kimi K2.6, точной Opus 4.7 и быстрой GPT-5.5. Неделя на настройку, и вы делаете работу четырёх человек с расходами одного.