12

Победитель соревнований по программированию рассказал, как смог обойти ИИ

Победитель соревнований по программированию рассказал, как смог обойти ИИ

Недавно модель OpenAIAHC от OpenAI заняла второе место на финале соревнований по программированию AtCoder World Tour Finals 2025 в разделе эвристики, уступив только Пржемыславу Psycho Дебиаку из Польши. Интересно, что сам Пржемыслав ранее работал в OpenAI, и согласился разобрать действия модели, указав на ее сильные стороны и ограничения.

Задачей было написать программу, прокладывающую маршрут робота по полю 30 × 30 клеток так, чтобы он прошел от старта до финиша (и по желанию заехал за бонусами) как можно меньшим числом ходов, не врезаясь в стены. У задачи нет простого и быстрого решения, поэтому, начав с работающих прототипов, участники на протяжении 10 часов пытались выжать максимальную производительность.

За счет скорости перебора вариантов OpenAIAHC опубликовала первый черновик уже на 15 минуте соревнования, а к 1:40 улучшила его в 4,4 раза — Пржемыслав на тот момент отставал в два раза. Но затем ситуация стала меняться: "живые" участники приступили к смелым оптимизациям кода, которые давали по 20-30% роста, а модель увлеклась шлифовкой решения, улучшая результат на считанные проценты и даже доли процента. Начиная с 6 часа OpenAIAHC практически вышла на плато, а остальные участники продолжали находить рабочие варианты. В итоге Psyho набрал 83,1 балла, OpenAIAHC — 75,6 балла, причем ее почти нагнал пришедший третьим Terry_u16.

Пржемыслав назвал несколько причин своей победы. Во-первых, он наметил, какие алгоритмы тестировать, в каком порядке фиксировать метрики и когда менять подход — ИИ такую "дорожную карту" создать не смог. Во-вторых, он постоянно вычищал лишний код, в то время как OpenAIAHC накапливала мусор, не трогая его, "чтобы не сломалось". Наконец, в-третьих, когда Пржемыслав увидел, что уперся в потолок, он кардинально поменял алгоритм поиска пути — ИИ на такие смелые шаги не решался, а продолжал "выжимать" максимум из текущего решения.

Уже после соревнования OpenAI прогнала решение Пржемыслава через OpenAIAHC, которая улучшила результат на 8 баллов, пусть и добавив в "код" мусора. В целом Пржемыслав считает, что нейросетям еще далеко до живых программистов по креативности, но отмечает, что уже сейчас для подобных задач оптимальна связка, где ИИ быстро готовит множество шаблонов, а человек — выбирает лучшие из них.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Искусственный интеллект

4.6K постов11.3K подписчиков

Правила сообщества

ВНИМАНИЕ! В сообществе запрещена публикация генеративного контента без детального описания промтов и процесса получения публикуемого результата.


Разрешено:


- Делиться вопросами, мыслями, гипотезами, юмором на эту тему.

- Делиться статьями, понятными большинству аудитории Пикабу.

- Делиться опытом создания моделей машинного обучения.

- Рассказывать, как работает та или иная фиговина в анализе данных.

- Век жить, век учиться.


Запрещено:


I) Невостребованный контент

  I.1) Создавать контент, сложный для понимания. Такие посты уйдут в минуса лишь потому, что большинству неинтересно пробрасывать градиенты в каждом тензоре реккурентной сетки с AdaGrad оптимизатором.

  I.2) Создавать контент на "олбанском языке" / нарочно игнорируя правила РЯ даже в шутку. Это ведет к нечитаемости контента.

  I.3) Добавлять посты, которые содержат лишь генеративный контент или нейросетевой Арт без какой-то дополнительной полезной или интересной информации по теме, без промтов или описания методик создания и т.д.


II) Нетематический контент

  II.1) Создавать контент, несвязанный с Data Science, математикой, программированием.

  II.2) Создавать контент, входящий в противоречие существующей базе теорем математики. Например, "Земля плоская" или "Любое действительное число представимо в виде дроби двух целых".

  II.3) Создавать контент, входящий в противоречие с правилами Пикабу.


III) Непотребный контент

  III.1) Эротика, порнография (даже с NSFW).

  III.2) Жесть.


За нарушение I - предупреждение

За нарушение II - предупреждение и перемещение поста в общую ленту

За нарушение III - бан