Короче, у OpenAI есть штука под названием Codex — это такой ИИ-помощник для программистов, который живёт прямо в терминале и пишет код. До недавнего времени работало это как обычный чат: ты говоришь — он отвечает. Ты пишешь задачу — он пишет код. Шаг туда, шаг сюда.
А 30 апреля они выкатили обновление, в котором появилась команда /goal. И это уже не чат. Это режим, когда ты говоришь агенту цель — и он работает над ней сам. Часами. Без твоего участия. Пишет код, тестирует, видит ошибки, переделывает, снова тестирует. И так пока не достигнет цели или не упрётся в лимит токенов.
Я неделю с этим прожил. Расскажу, что получилось.
Сначала прикольная история из твиттера
Парень с ником @NicolasZu запустил /goal для своей игры (зомби, башенки, обычное дело). Цель: повысить производительность игры. Запуск — один час на самой умной модели OpenAI (GPT-5.5 в режиме xhigh).
Через час агент вернулся с результатом: +25% fps. То есть игра стала работать быстрее на четверть. Что он сделал за этот час: оптимизировал движение зомби, кэшировал данные WASM, переиспользовал объекты для боевой механики башен, добавил быстрые helper-функции. Всё это автоматически. Без программиста.
А теперь грабля
Главная проблема /goal — не качество кода. Не зацикливания. И даже не то, что он там фигню напишет.
Главная проблема — траты токенов абсолютно непредсказуемы.
Не «много» — а именно непредсказуемо. Одна и та же задача, поставленная одинаково, может стоить 80 000 токенов в одном случае и 400 000 в другом. В пять раз больше! Без видимой причины. Иногда агент быстро находит решение и закрывает цель за два цикла. Иногда уходит в спираль — пишет, проверяет, переписывает, снова проверяет, снова не нравится — и сжигает в пять раз больше денег.
И ты не знаешь заранее, какой будет цена.
Это бесит, потому что нельзя планировать бюджет. У тебя есть 5-часовой план в подписке OpenAI — а сколько /goal-сессий туда поместится? Может три. Может одна. Никаких гарантий.
Засада, про которую мало кто пишет
Когда упираешься в лимит токенов — /goal не падает. Агент продолжает что-то генерить. Но при этом инструменты, которым нужен отдельный «токен на разрешение» (типа поиска по документации или работы с базой), — молча перестают работать.
То есть сессия выглядит живой. Агент пишет. На экране всё нормально. А на самом деле он работает наполовину обезоруженный.
Я в первый раз поймал это так: запустил на ночь, утром пришёл — красивый коммит на GitHub, всё зелёное. Полез проверить — миграции базы не выполнены. Тесты прошли только потому, что не было настоящих изменений в схеме. Час смотрел, в чём дело. Оказалось — упёрся в лимит ещё в три ночи, остаток сессии был мертвый.
Команда /side — для расшифровки англицизмов
Тут вообще смешная штука. У них есть вторая новая команда — /side. Открываешь её — у тебя появляется дополнительный мини-чат, где можно что-то спросить, не сбивая основную задачу. Удобно.
Я думал, буду использовать её для уточнений по плану. И использую. Но чаще всего открываю /side чтобы расшифровать, что мне сказал GPT-5.5.
Эта модель использует столько английских технических слов в одном предложении, что иногда я просто не понимаю, о чём речь. Слова вроде «coalesce», «obviation», «debouncing», «invariant» — в одном абзаце. Часть очевидна, часть нет. Открываю /side, спрашиваю: «расскажи это простыми словами на русском, что значит вот это». Получаю короткий ответ. Закрываю. Возвращаюсь к работе.
Не думал, что новейшая фича OpenAI будет работать у меня переводчиком с английского технического на русский технический. Но вот.
Кто в команде взялся первым — внезапно
Я думал, /goal подхватят первыми те, кто пишет код. Производительность, рефакторинг, миграции — классика. Не подхватили. Попробовали — не пошло.
А первыми реально взялись исследователи. Те, кто работает над сбором информации и данных для проектов. Им /goal зашёл сильнее всего, потому что у них всё совпало: есть конкретная цель (улучшить точность какой-то метрики), есть число, которое можно измерить, и чёткий контекст. Все три условия, которые /goal любит.
Программисты пока больше тестируют. Активно не используют. Не прижилось.
Когда это вообще нельзя запускать
На проде. Агент может коммитить, мержить, рестартить. Один неудачный цикл — и у тебя 47 коммитов с бессмыслицей.
Без чёткой цели. Если попросить «сделай код лучше» — агент уйдёт в бесконечный цикл переписываний и сожжёт деньги.
Без присмотра. Совсем без присмотра — нельзя. Возвращаться раз в 15-20 минут, проверять, на что уходят токены, быть готовым нажать /goal pause.
Главное
Раньше Codex был чат-ботом, который пишет код по реплике. Теперь это штука, которая сама часами что-то делает с твоим репозиторием. Иногда отдаёт +25% fps за час, как у того парня с зомби. Иногда сжигает в пять раз больше токенов и ничего внятного не приносит.
Расплата за автономность — ты не знаешь, сколько это будет стоить. И не до конца понимаешь, что именно агент сейчас творит у тебя в проекте.
Попробовать всё равно стоит. Когда эта штука перестанет быть экспериментальной (а пока она включается отдельной настройкой) — не хочется учиться на ходу.
Если интересны такие штуки про AI-агентов, фейлы и победы из реальной работы — у меня канал в Телеграме @maslennikovigor. Там же выкладываю разборы граблей, которыми не хочется делиться публично.
Полная техническая версия с разбором архитектуры /goal, описанием её активации и других новых команд — на Хабре.