Китай вырвался вперёд по открытым ИИ-моделям: что показали свежие рейтинги⁠⁠

Коротко. В пользовательском рейтинге Design Arena сейчас первые 16 мест среди открытых моделей занимают китайские. Первая не китайская идёт следом — OpenAI gpt-oss-120B. Это официально подтвердили в самом Design Arena.

Второй взгляд. Композитный индекс Artificial Analysis, который собирает результаты тяжёлых тестов по математике, науке и коду, тоже фиксирует рывок: DeepSeek R1 0528 поднялась до 68 баллов и сравнялась с лидерами.

Масштаб. По данным с конференции WAIC в Шанхае, в Китае насчитали 1509 больших моделей — более 40% от мирового числа.

Китай вырвался вперёд по открытым ИИ-моделям: что показали свежие рейтинги Digital, Нейронные сети, Telegram (ссылка), Длиннопост

Что такое эти рейтинги и почему они разные

Design Arena — «арена» с парными сравнениями. Пользователю показывают два анонимных ответа на один запрос, он выбирает лучший, дальше считается рейтинг по Elo. Это про то, что людям реально нравится читать и использовать.

Artificial Analysis — не голосование, а сводка строгих бенчмарков. В их Intelligence Index сходятся AIME, GPQA Diamond, LiveCodeBench, Humanity’s Last Exam и другие оценки, чтобы показать общую «смекалку» модели.

Почему Китай так силён в открытых моделях

Темп релизов и доработок. Появляются новые версии семейства DeepSeek, Qwen, Kimi, GLM и быстро шлифуются по фидбеку. На арене это видно сразу, а в тестах — по индексам.
Фокус на доступности. Модели проще брать в работу и адаптировать под конкретные задачи, поэтому они быстрее расходятся по индустриям и комьюнити. Итог — много очков и в «человеческом» рейтинге, и в «железных» тестах.

Что в США

США по-прежнему держат мощные закрытые продукты от OpenAI, Anthropic, Google и xAI. Но тренд на открытость тоже нарастает: 5 августа OpenAI представила семейство gpt-oss с двумя открытыми моделями — 120B и 20B — под Apache 2.0 и с детальными карточками.

Если хочешь без лишних настроек просто поработать с нейросетями и сравнить подходы — открой бота.