Победитель соревнований по программированию рассказал, как смог обойти ИИ
Недавно модель OpenAIAHC от OpenAI заняла второе место на финале соревнований по программированию AtCoder World Tour Finals 2025 в разделе эвристики, уступив только Пржемыславу Psycho Дебиаку из Польши. Интересно, что сам Пржемыслав ранее работал в OpenAI, и согласился разобрать действия модели, указав на ее сильные стороны и ограничения.
Задачей было написать программу, прокладывающую маршрут робота по полю 30 × 30 клеток так, чтобы он прошел от старта до финиша (и по желанию заехал за бонусами) как можно меньшим числом ходов, не врезаясь в стены. У задачи нет простого и быстрого решения, поэтому, начав с работающих прототипов, участники на протяжении 10 часов пытались выжать максимальную производительность.
За счет скорости перебора вариантов OpenAIAHC опубликовала первый черновик уже на 15 минуте соревнования, а к 1:40 улучшила его в 4,4 раза — Пржемыслав на тот момент отставал в два раза. Но затем ситуация стала меняться: "живые" участники приступили к смелым оптимизациям кода, которые давали по 20-30% роста, а модель увлеклась шлифовкой решения, улучшая результат на считанные проценты и даже доли процента. Начиная с 6 часа OpenAIAHC практически вышла на плато, а остальные участники продолжали находить рабочие варианты. В итоге Psyho набрал 83,1 балла, OpenAIAHC — 75,6 балла, причем ее почти нагнал пришедший третьим Terry_u16.
Пржемыслав назвал несколько причин своей победы. Во-первых, он наметил, какие алгоритмы тестировать, в каком порядке фиксировать метрики и когда менять подход — ИИ такую "дорожную карту" создать не смог. Во-вторых, он постоянно вычищал лишний код, в то время как OpenAIAHC накапливала мусор, не трогая его, "чтобы не сломалось". Наконец, в-третьих, когда Пржемыслав увидел, что уперся в потолок, он кардинально поменял алгоритм поиска пути — ИИ на такие смелые шаги не решался, а продолжал "выжимать" максимум из текущего решения.
Уже после соревнования OpenAI прогнала решение Пржемыслава через OpenAIAHC, которая улучшила результат на 8 баллов, пусть и добавив в "код" мусора. В целом Пржемыслав считает, что нейросетям еще далеко до живых программистов по креативности, но отмечает, что уже сейчас для подобных задач оптимальна связка, где ИИ быстро готовит множество шаблонов, а человек — выбирает лучшие из них.
P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.