Вышла новая модель Kimi-K2.6
Выложили новую open-source модель Kimi-K2.6 (https://huggingface.co/moonshotai/Kimi-K2.6) с улучшенными возможностями длительного кодирования, агентных роев (до 300 субагентов) и проактивных агентов.
Её кодирование получило существенный прирост в сложных задачах (с 57.4 до 68.2 на Kimi Code Bench), и, например, 12-часовая оптимизация вывода Qwen на Zig дало ускорение с 15 до 193 токенов/с, а оптимизация матчинга exchange-core повысила производительность на 133%.
Генерируя код дизайна, она разрабатывает интерфейсы и full-stack прототипы из промта, а на тесте Kimi Design Bench в 47.5% случаев лучше Google AI Studio.
Используя агентные рои, можно горизонтально масштабировать задачи, интегрировать внешние навыки и координировать гетерогенными агентами в Claw Groups.
Выполняя задачу, проактивные агенты могут автономно работать до 5 дней (OpenClaw, Hermes). Кроме того, наблюдается улучшение на Claw Bench с 59.6 до 65.5.
Многочисленные партнёры в лице Baseten, Blackbox AI, CodeBuddy, Factory, Fireworks AI, Nous Research, Kilo Code, Ollama, OpenCode, Qoder и Vercel отмечают надёжность, следование инструкциям и прогресс в длительных задачах.
В результате модель либо лидирует, либо конкурентоспособна, получив 54.0 на HLE-Full w/ tools, 83.2 на BrowseComp, 92.5 на DeepSearchQA, 66.7 на Terminal-Bench 2.0 и 58.6 на SWE-Bench Pro.



