Победитель соревнований по программированию рассказал, как смог обойти ИИ⁠⁠

Недавно модель OpenAIAHC от OpenAI заняла второе место на финале соревнований по программированию AtCoder World Tour Finals 2025 в разделе эвристики, уступив только Пржемыславу Psycho Дебиаку из Польши. Интересно, что сам Пржемыслав ранее работал в OpenAI, и согласился разобрать действия модели, указав на ее сильные стороны и ограничения.

Задачей было написать программу, прокладывающую маршрут робота по полю 30 × 30 клеток так, чтобы он прошел от старта до финиша (и по желанию заехал за бонусами) как можно меньшим числом ходов, не врезаясь в стены. У задачи нет простого и быстрого решения, поэтому, начав с работающих прототипов, участники на протяжении 10 часов пытались выжать максимальную производительность.

За счет скорости перебора вариантов OpenAIAHC опубликовала первый черновик уже на 15 минуте соревнования, а к 1:40 улучшила его в 4,4 раза — Пржемыслав на тот момент отставал в два раза. Но затем ситуация стала меняться: "живые" участники приступили к смелым оптимизациям кода, которые давали по 20-30% роста, а модель увлеклась шлифовкой решения, улучшая результат на считанные проценты и даже доли процента. Начиная с 6 часа OpenAIAHC практически вышла на плато, а остальные участники продолжали находить рабочие варианты. В итоге Psyho набрал 83,1 балла, OpenAIAHC — 75,6 балла, причем ее почти нагнал пришедший третьим Terry_u16.

Пржемыслав назвал несколько причин своей победы. Во-первых, он наметил, какие алгоритмы тестировать, в каком порядке фиксировать метрики и когда менять подход — ИИ такую "дорожную карту" создать не смог. Во-вторых, он постоянно вычищал лишний код, в то время как OpenAIAHC накапливала мусор, не трогая его, "чтобы не сломалось". Наконец, в-третьих, когда Пржемыслав увидел, что уперся в потолок, он кардинально поменял алгоритм поиска пути — ИИ на такие смелые шаги не решался, а продолжал "выжимать" максимум из текущего решения.

Уже после соревнования OpenAI прогнала решение Пржемыслава через OpenAIAHC, которая улучшила результат на 8 баллов, пусть и добавив в "код" мусора. В целом Пржемыслав считает, что нейросетям еще далеко до живых программистов по креативности, но отмечает, что уже сейчас для подобных задач оптимальна связка, где ИИ быстро готовит множество шаблонов, а человек — выбирает лучшие из них.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

[моё] Программирование ChatGPT IT Искусственный интеллект Gpt4 Openai

4.6K постов11.3K подписчиков

Добавить пост

Правила сообщества

ВНИМАНИЕ! В сообществе запрещена публикация генеративного контента без детального описания промтов и процесса получения публикуемого результата.

Разрешено:

- Делиться вопросами, мыслями, гипотезами, юмором на эту тему.

- Делиться статьями, понятными большинству аудитории Пикабу.

- Делиться опытом создания моделей машинного обучения.

- Рассказывать, как работает та или иная фиговина в анализе данных.

- Век жить, век учиться.

Запрещено:

I) Невостребованный контент

I.1) Создавать контент, сложный для понимания. Такие посты уйдут в минуса лишь потому, что большинству неинтересно пробрасывать градиенты в каждом тензоре реккурентной сетки с AdaGrad оптимизатором.

I.2) Создавать контент на "олбанском языке" / нарочно игнорируя правила РЯ даже в шутку. Это ведет к нечитаемости контента.

I.3) Добавлять посты, которые содержат лишь генеративный контент или нейросетевой Арт без какой-то дополнительной полезной или интересной информации по теме, без промтов или описания методик создания и т.д.

II) Нетематический контент

II.1) Создавать контент, несвязанный с Data Science, математикой, программированием.

II.2) Создавать контент, входящий в противоречие существующей базе теорем математики. Например, "Земля плоская" или "Любое действительное число представимо в виде дроби двух целых".

II.3) Создавать контент, входящий в противоречие с правилами Пикабу.

III) Непотребный контент

III.1) Эротика, порнография (даже с NSFW).

III.2) Жесть.

За нарушение I - предупреждение

За нарушение II - предупреждение и перемещение поста в общую ленту

За нарушение III - бан