Codex: истории из жизни, советы, новости, юмор и картинки — Горячее

0 просмотренных постов скрыто

Escaped.AI

Искусственный интеллект

За полчаса ИИ собрал себе веб-панель управления сервером. Я не писал ни строчки⁠⁠

3 дня назад

Сижу, смотрю в браузере на интерфейс: загрузка файлов, список черновиков, окно для правок и комментариев, кнопка "вернуть агенту в работу". Все работает. И я понимаю, что не написал к этому ни строчки кода — только рассказал словами, что хочу получить. ИИ-агент собрал это сам, минут за тридцать-сорок.

Эта панель мне понадобилась не от хорошей жизни. Две недели назад я снял свой ИИ-стек (Claude Code + Codex CLI) с домашнего ПК и перенес на VPS — виртуальный сервер. Цель была простая: чтобы агент работал, пока я сплю, езжу по делам или занимаюсь детьми. Но как только я зашел туда по SSH (это текстовый канал связи с удаленной машиной), я обнаружил, что живу теперь сразу в двух очень разных мирах.

Первый мир — это сам Linux в терминале. Минимальный интерфейс, текстовые команды, никаких окошек. По сути, внешний вид с 70-х изменился не сильно. Тут все по-старому: команды набираете руками, ответы читаете в текстовой ленте. Спокойно, надежно, требует терпения. Ну или настройки — использование tmux и Termius очень упрощает жизнь.

Второй мир — это ИИ-агент, который живет на этом же сервере. И вот здесь начинается удивительное. Когда агент получает root-доступ (права администратора, "ключ от всего"), он перестает быть просто помощником в чате. Он становится чем-то вроде прото-операционной системы. Нужна функция? Описываете словами. Получаете варианты. Одобряете. Агент идет и делает. Та самая веб-панель родилась именно так — мне было лень закидывать черновики через консоль, я сказал об этом агенту, он предложил варианты, через сорок минут панель работала.

Отдельный сюжет — что у меня там пара агентов. Claude Code на модели Opus 4.7 люблю за способность писать понятно, почти как живой коллега-наставник. Codex на GPT-5.5 — это скорость и качественно реализованный код. Они часто работают в паре: один пишет, второй проверяет.

Честно, не все гладко. Агенты периодически идут не туда, и приходится откатывать изменения через git (система контроля версий, хранит историю правок и позволяет вернуться назад). Один раз Codex решил оптимизировать конфиг и положил мне веб-сервер на двадцать минут. Поэтому root-доступ — это всегда компромисс между удобством и риском: бэкапы, версионирование, ограничения прав — без этого жить нельзя.

Если интересна техническая сторона — какой VPS брать, какие настройки делать на старте, как организовать совместную работу двух агентов — я расписал все это в отдельном лонгриде на Бусти. В короткий пост это просто не влезает.

Да и в целом приглашаю подписаться, у меня в подписке пачка полезных текстов от промптинга до работы с ИИ-агентами.

Показать полностью 1

Programma.Boinc

Наука

BOINC Pentathlon 2026: четвёртый день, три дисциплины из пяти⁠⁠

5 дней назад

BOINC Pentathlon 2026: четвёртый день, три дисциплины из пяти

С 5 мая идёт XVII BOINC Pentathlon — двухнедельный командный турнир от SETI.Germany. 14 дней, 5 дисциплин, 21 команда. Финиш — 19 мая 00:00 UTC.

Что уже работает прямо сейчас:

– Marathon — MilkyWay5–19 мая, все 14 дней. Чистый CPU: с 2023 года GPU-часть проекта закрыта, остался только N-body. Считают звёздные потоки и карликовые галактики, чтобы ограничить параметры тёмной материи и галактического потенциала. Для зачёта нужен credit, выданный во время окна — pending в счёт не идут.

– Steeplechase — PrimeGrid SR5 Sieve (5–12 мая, 7 дней). Подпроект-сито для Sierpinski/Riesel Base 5: ищет малые делители у кандидатов формы k·5^n±1, чтобы убрать их из дальнейшего LLR-теста. CPU only. Внутри окна — два случайных бонусных дня с множителем 20%, 30% или 50%; даты не объявляются заранее. Чтобы задачи пошли в зачёт, в Project Preferences PrimeGrid нужно вручную выбрать SR5 Sieve.

– Javelin Throw — SRBase, CPU only (старт сегодня). Пять однодневных «бросков», засчитывается третий по величине результат — стратегия важнее, чем выложиться в один день. Бросок 1: 8–9 мая, бросок 2: 9–10 мая, остальные три объявят по ходу.

Sprint и City Run пока не объявлены — стандартный формат Pentathlon, проекты сообщают за 3 дня до старта дисциплины.

Как влиться сейчас.

Завести аккаунт на milkyway.cs.rpi.edu и primegrid.com (для Javelin — на srbase.my-firewall.org), прикрепиться к любой зарегистрированной команде. На PrimeGrid отдельно поставить галку SR5 Sieve в настройках проекта, иначе подпроект не приедет. BOINC-клиент за тебя поставит и настроит ИИ-агент с доступом к терминалу — Claude Code, Codex, Cursor.

Расписание и зачёт: https://www.seti-germany.de/boinc_pentathlon/

Автор: Сергей

https://milkyway.cs.rpi.edu/milkyway/

https://vk.com/home

BOINC Pentathlon 2026: четвёртый день, три дисциплины из пяти

Показать полностью 1

Компьютерное железо Раздача Искусственный интеллект Научпоп Codex Ученые Milky way Javelin ВКонтакте (ссылка)

vadimstegkov

Лига Разработчиков Видеоигр

Игры

Как я сделал мобильную игру через ИИ, не написав ни одной строчки кода⁠⁠

5 дней назад

Звучит как кликбейт, но я реально сделал мобильную игру ПОЛНОСТЬЮ через ИИ. Сам в код не лез вообще. Ни одной строчки руками не писал.

Работал я с Codex: это ИИ, который может читать проект, менять файлы, собирать APK и чинить баги. Моя роль была примерно такая: сначала задаю концепт и описываю просто текстом механику, затем тестирую игру на телефоне, вижу что не нравится, пишу список правок человеческим языком.

За основу механики я выбрал что-то в духе Flappy Bird: летишь, уворачиваешься от колонн, стараешься прожить дольше и набрать очки. А визуально хотелось спокойную атмосферу в стиле Alto’s Adventure: горы, мягкие цвета, смена дня и ночи, закаты, дождь, гроза, минималистичные персонажи.

Дальше начался странный дуэт: я как занудный арт-директор и тестировщик, Codex как программист, художник на Canvas, звуковик и сборщик Android в одном лице. Я писал что-то вроде: “птицу ночью вообще не видно”, “монетка какая-то отстойная”, “флаг отрывается от палки”, “солнце некрасивое”, “убери это совсем”. ИИ шел в код, правил, собирал новую APK. Я ставил на телефон, тестировал, снова писал список.

Проблем всплыло много. Иногда после одной правки ломалось что-то рядом. След за птицей выглядел красиво, но игра начала лагать. Иконка нормально смотрелась квадратной, но в круглой версии обрезалась. Луна при восходе сначала светила слабо, потом резко включала ореол. Нижние колонны пару раз становились полупрозрачными, и я уже почти начал воспринимать это как личное оскорбление.

Но самое интересное, что все это реально постепенно допиливалось. Не “ИИ сделал идеальную игру с первого промпта”, такого не было. Скорее процесс был похож на обычную разработку: баги, правки, сборки, тесты, новые баги, снова правки. Только вместо того чтобы самому копаться в коде, я объяснял, что хочу получить в результате обычным языком.

В итоге игра добралась до нормального состояния: с меню, магазином скинов, монетками, сменой дня и ночи, дождем, грозой, звуками, вибрацией, фоторежимом и сборкой под Android.

После этого я подготовил файлы и выложил игру в RuStore.

Для меня это был очень странный опыт. Раньше “сделать мобильную игру” означало либо уметь программировать, либо искать разработчика. А тут оказалось, что можно быть человеком с идеей, телефоном для тестов и большим запасом придирок.

Не знаю, заменит ли это нормальную разработку. Скорее нет. Но как инструмент для человека, который хочет собрать свою маленькую игру и готов много тестировать, спорить с результатом и докручивать детали, это уже работает. Причем иногда пугающе хорошо.

Ссылка на мою игру в Rustore: https://www.rustore.ru/catalog/app/com.codex.skytemple

Скриншоты из игры:

1/6

Показать полностью 6

[моё] Разработка Gamedev Инди Инди игра Искусственный интеллект Codex ChatGPT Длиннопост

igor3k

Тестировал автономного AI-агента OpenAI: получил +25% к производительности и счёт за токены, который я не смог предсказать⁠⁠

6 дней назад

Короче, у OpenAI есть штука под названием Codex — это такой ИИ-помощник для программистов, который живёт прямо в терминале и пишет код. До недавнего времени работало это как обычный чат: ты говоришь — он отвечает. Ты пишешь задачу — он пишет код. Шаг туда, шаг сюда.

А 30 апреля они выкатили обновление, в котором появилась команда /goal. И это уже не чат. Это режим, когда ты говоришь агенту цель — и он работает над ней сам. Часами. Без твоего участия. Пишет код, тестирует, видит ошибки, переделывает, снова тестирует. И так пока не достигнет цели или не упрётся в лимит токенов.

Я неделю с этим прожил. Расскажу, что получилось.

Сначала прикольная история из твиттера

Парень с ником @NicolasZu запустил /goal для своей игры (зомби, башенки, обычное дело). Цель: повысить производительность игры. Запуск — один час на самой умной модели OpenAI (GPT-5.5 в режиме xhigh).

Через час агент вернулся с результатом: +25% fps. То есть игра стала работать быстрее на четверть. Что он сделал за этот час: оптимизировал движение зомби, кэшировал данные WASM, переиспользовал объекты для боевой механики башен, добавил быстрые helper-функции. Всё это автоматически. Без программиста.

Звучит магически.

А теперь грабля

Главная проблема /goal — не качество кода. Не зацикливания. И даже не то, что он там фигню напишет.

Главная проблема — траты токенов абсолютно непредсказуемы.

Не «много» — а именно непредсказуемо. Одна и та же задача, поставленная одинаково, может стоить 80 000 токенов в одном случае и 400 000 в другом. В пять раз больше! Без видимой причины. Иногда агент быстро находит решение и закрывает цель за два цикла. Иногда уходит в спираль — пишет, проверяет, переписывает, снова проверяет, снова не нравится — и сжигает в пять раз больше денег.

И ты не знаешь заранее, какой будет цена.

Это бесит, потому что нельзя планировать бюджет. У тебя есть 5-часовой план в подписке OpenAI — а сколько /goal-сессий туда поместится? Может три. Может одна. Никаких гарантий.

Засада, про которую мало кто пишет

Когда упираешься в лимит токенов — /goal не падает. Агент продолжает что-то генерить. Но при этом инструменты, которым нужен отдельный «токен на разрешение» (типа поиска по документации или работы с базой), — молча перестают работать.

То есть сессия выглядит живой. Агент пишет. На экране всё нормально. А на самом деле он работает наполовину обезоруженный.

Я в первый раз поймал это так: запустил на ночь, утром пришёл — красивый коммит на GitHub, всё зелёное. Полез проверить — миграции базы не выполнены. Тесты прошли только потому, что не было настоящих изменений в схеме. Час смотрел, в чём дело. Оказалось — упёрся в лимит ещё в три ночи, остаток сессии был мертвый.

Команда /side — для расшифровки англицизмов

Тут вообще смешная штука. У них есть вторая новая команда — /side. Открываешь её — у тебя появляется дополнительный мини-чат, где можно что-то спросить, не сбивая основную задачу. Удобно.

Я думал, буду использовать её для уточнений по плану. И использую. Но чаще всего открываю /side чтобы расшифровать, что мне сказал GPT-5.5.

Эта модель использует столько английских технических слов в одном предложении, что иногда я просто не понимаю, о чём речь. Слова вроде «coalesce», «obviation», «debouncing», «invariant» — в одном абзаце. Часть очевидна, часть нет. Открываю /side, спрашиваю: «расскажи это простыми словами на русском, что значит вот это». Получаю короткий ответ. Закрываю. Возвращаюсь к работе.

Не думал, что новейшая фича OpenAI будет работать у меня переводчиком с английского технического на русский технический. Но вот.

Кто в команде взялся первым — внезапно

Я думал, /goal подхватят первыми те, кто пишет код. Производительность, рефакторинг, миграции — классика. Не подхватили. Попробовали — не пошло.

А первыми реально взялись исследователи. Те, кто работает над сбором информации и данных для проектов. Им /goal зашёл сильнее всего, потому что у них всё совпало: есть конкретная цель (улучшить точность какой-то метрики), есть число, которое можно измерить, и чёткий контекст. Все три условия, которые /goal любит.

Программисты пока больше тестируют. Активно не используют. Не прижилось.

Когда это вообще нельзя запускать

На проде. Агент может коммитить, мержить, рестартить. Один неудачный цикл — и у тебя 47 коммитов с бессмыслицей.
Без чёткой цели. Если попросить «сделай код лучше» — агент уйдёт в бесконечный цикл переписываний и сожжёт деньги.
Без присмотра. Совсем без присмотра — нельзя. Возвращаться раз в 15-20 минут, проверять, на что уходят токены, быть готовым нажать /goal pause.

Главное

Раньше Codex был чат-ботом, который пишет код по реплике. Теперь это штука, которая сама часами что-то делает с твоим репозиторием. Иногда отдаёт +25% fps за час, как у того парня с зомби. Иногда сжигает в пять раз больше токенов и ничего внятного не приносит.

Расплата за автономность — ты не знаешь, сколько это будет стоить. И не до конца понимаешь, что именно агент сейчас творит у тебя в проекте.

Попробовать всё равно стоит. Когда эта штука перестанет быть экспериментальной (а пока она включается отдельной настройкой) — не хочется учиться на ходу.

Если интересны такие штуки про AI-агентов, фейлы и победы из реальной работы — у меня канал в Телеграме @maslennikovigor. Там же выкладываю разборы граблей, которыми не хочется делиться публично.

Полная техническая версия с разбором архитектуры /goal, описанием её активации и других новых команд — на Хабре.

Показать полностью 1

Codex Openai Искусственный интеллект Нейронные сети Программирование Telegram (ссылка) Длиннопост

Escaped.AI

Искусственный интеллект

GPT-5.5: инструкция по применению⁠⁠

14 дней назад

Сейчас много работаю с GPT-5.5 и настало время поделиться опытом. Плюс OpenAI выкатила гайд по промптингу модели – он больше заточен под API, но базовую вещь из него полезно знать всем.

Но сначала о самой модели. Я любил предыдущие GPT-5 за умение круто рассуждать (в том числе – критиковать) и глубоко искать в сети. Но два минуса, из-за которых я почти перестал пользоваться моделью – корявый стиль текстов и скорость, когда даже на простой вопрос модель могла отвечать до нескольких минут. В GPT-5.5 исправили обе проблемы.

По стилю это первая GPT, которой я доверил написание новостей. Она пишет интересные художественные тексты, способна помочь с заголовками, объяснить сложную тему и просто поболтать. Gemini 3.1 Pro и Opus 4.7 по стилю все еще чуть впереди – но GPT-5.5 в ответах реже галлюцинирует и преувеличивает.

Увы, до конца не починили проблему, когда в разговорах на сложные темы (наука, медицина, IT) GPT-5.5 сыпет профессиональными терминами и непереведенными словами. Помогает добавить в “Персонализация > пользовательские инструкции” следующее:

Пиши понятным русским языком без англицизмов и не переведенных слов за исключением ситуаций, где английский устоявшийся. Сложные темы старайся объяснять так, чтобы они хотя бы базово были понятны неспециалисту.

Дальше скорость. Я сравнивал в навороченном поиске: где GPT-5.4 возилась 7-8 минут, GPT-5.5 справлялась максимум за 2-3. Плюс модель лучше определяет сложность запросов – я почти не сталкивался со случаями, когда на ерунду GPT-5.5 отвечала бы по 1-2 минуты.

В свое время с проблемами скорости OpenAI боролась добавив ручной выбор глубины рассуждений. Сейчас эта опция выглядит ненужной: на подписке ChatGPT Pro я использую максимальную настройку Heavy (“Глубокое”) – простые задачи вроде “проверь стиль русского языка” модель решает за 5-10 секунд, сложные за 2-3 минуты. На подписке ChatGPT Plus ставьте Extended (Расширенное) – получите максимальное качество при хорошей скорости.

Теперь про промптинг GPT-5.5. Главный совет OpenAI – не тащить в новые модели старые многоэтажные промпты, где расписан каждый шаг, а стараться дать ей свободу самой выбирать, как работать.

Причина – мы вступили в эру агентских ИИ, когда модели прокачивают максимально следовать инструкциям. Для агентов это хорошо, но если обычный промпт перегрузить лишними инструкциями, то модель просто будет до упора им следовать и сделает дрянь.

Расскажу на примере опыта с Claude Opus, который развивается тем же маршрутом. Я в свое время заморочился и сделал для него скилл написания новостей, куда вложил весь свой опыт: какие структуры и приемы в заголовках работают, какую структуру дать основному тексту, какой объем, стиль, как делать фактчек и пр. Но правила нужны для того, чтобы их нарушать – и тот же Opus 4.5 при просьбе легко выходил за рамки.

С Opus 4.6 все стало хуже, а с Opus 4.7 началась вообще катастрофа. Просишь в этот раз сделать совсем простой заголовок или написать на абзац больше лимита – и модель закатывает натуральную истерику с аргументом “ведь в твоем же правиле сказано другое!”.

Куда лучше Opus 4.7 и GPT-5.5 работают по шаблону промпта, следующему из гайда OpenAI:

– описание задачи

– нужный модели контекст

– ожидаемый результат

– инструкции и ограничения, которые реально важны

У всех нас разные задачи, поэтому дам общий совет: сначала постарайтесь написать максимально простой промпт под свою задачу. Протестируйте модель на нем, если она что-то делает не так – просто попросите в диалоге исправить, а в следующий раз уже добавьте эту инструкцию в промпт. Несколько дней такой работы – и вы интуитивно начнете понимать, какая нужна глубина постановки задачи в каждом случае.

На "Бусти" я делюсь личным опытом использования нейросетей. В том числе у меня есть серия текстов по правильном промптингу, которая поможет в работе с GPT-5.5 и другими современными моделями.
Самое время подписаться!

Показать полностью

[моё] ChatGPT Искусственный интеллект Нейронные сети IT Программирование Codex

AndrewWild

Юмор для всех и каждого

Ответ на пост «Шурик в матрице»⁠⁠1

14 дней назад

Вчера посмотрел исходный пост Шурик в матрице и сразу же захотел пересмотреть матрицу. Скачал блю рей 4к HDR, благо есть неплохой телек и аудио. Я уже и забыл, как круто он сделан. Напомню фильм вышел в 99 году, т.е. снимать его начали в 98 году. Как ~~сестры~~ тогда еще братья смогли это все снять, имея технические возможности 90-х? Только в некоторых моментах, при 4к и большом телеке видел устаревшую графику. Лет 5 назад смотрел с супргой, она кино до этого не видела. Ее вывод был, что чушь полная и просто фантастика-боевик, кои она не любит. Вчера, я понял, что это уже нифига не фантастика, а вполне себе близкая реальность. Причем там в фильме прямо говорится о том, как человеки были в восторге от созданного ИИ и что из этого вышло. Короче Скайнет не за горами.

Это преамбула, а вот сама фабула в том, что хочу рассказать, как я начал свое знакомство с ИИ. Может кому будет полезно, кто еще не пользует, а спецы по ИИ скажут, что я лох педальный, поржут и поставят клоунов. Важный, как я считаю, дисклеймер: мне 35,5 годиков и я успел достаточно самостоятельно поработать (даже пару раз факс юзал). Т.е. сам вел тонны деловой переписки, составлял отчеты и прочее. И универ окончил без всяких ваших LLM. Т.е. Я именно использую ИИ как инструмент, ассистента, а нетупо все что он делает принимаю на слепую веру, он мне именно помогает.

Как, наверное, и многие познакомился с ИИ, когда вышла публичная версия GPT, доступная через ТГ. Ну зашел, спросил пару максимально всратых вопросов, немного офигел, но как его использовать я тогда даже придумать не мог. Через пару лет бывший коллега пригласил в качестве партнера в стартап. Я согласился т.к. знал о чем он и пару раз ему помогал с конкретными задачами. Стали писать партнерское соглашение. Тогда вроде яндкес чата то ли еще не было, то ли я не нашел. Как-то в яндексе писал текст, а он просто предлагал его улучшить и поправить. Очень пригодилось, он причесал текст, убрал логические ошибки и прочее. Это был первый реальный кейс использования. Далее мне подарили Алису. Стал подключаться к эко системе яндекса. Знаю сейчас Яндекс хаят, и по большей части с критикой согласен. Тут не суть. Я узнал о LLM от яндекса, даже купил про версию за целых сто рублей) Типичное использование сводилось к тому, что я, к примеру готовил письмо кому-то, а нейронка проверяла его на логику и вменяемость, давала рекомендации по улучшению. Либо я писал ей контекст для переговоров, какая диспозиция, чего хотим мы, чего предположительно хочет другая сторона. Она выдавала план на переговоры. И результат поражал на самом деле. Примерно выглядело так: 20% было откровенного бреда, 60% дельных и правильных вещей, которые я бы и сам написал, но на это ушло бы значительно больше времени, а самое интересное это оставшиеся 20%- тут я офигевал ибо понимал, что сам бы я не догадался до этого. Далее перехожу на дипсик, т.к. он работает без проблем в РФ и будет по смекалистей яндекса. Качество работы улучшилось, сложно объяснить словами, но решения, которые дипсик предлагал были горазда лучше. Т.е. к примеру вопросы "Мне надо помыть машину. Мойка в 100 метрах от дома. Стоит ли мне пойти пешком или поехать на машине"? Яндекс тупит, а дипсик дает правильный ответ.

А вот о чем уже давно слышал и хотел себе это ИИ агент, но не углублялся в тему, так как слышал об ограничениях для нашей страны. Но буквально на прошлой неделе был на профильном для себя вебинаре, и там факультативно показали агента Codex от Open AI. Я понял, что мне это прям то что я давно хотел, чего бы мне это не стоило. Пришлось немного заморочиться. Первый этап, это пройти регистрацию в самом Open AI. Тут нужно состоять в хорошем клубе веселых и находчивых, а также иметь доступ к зарубежной симке с вотсапом. Если у вас нету тети, то решается либо через друзей у кого есть, либо через посредников. Если прошли регу, то качаете на комп агента и можете юзать. Там есть бесплатные лимиты. Теперь о том, что же от такого для меня делает:

Подключил его к CRM. Он сам уже там ставит задачи и отмечет их выполнение.
Делает анализ ТГ чатов и каналов, и дает аналитику, советы и прочее именно по смыслу там написанного.
Делает финансовую аналитику. Пока через загрузку ексель отчета, например P&L, может делать выводы, может планировать, давать рекомендации и прогнозы. И может выдать сразу ввиде красивого отчета-презентации с графиками и прочим в формате HTML или Power point. Через апи к системе учета смогу его подключать чуть позже, тогда он уже на уровне бекенда будет там работать.
Может работать с графикой не критично сильно уступая специально обученным маркетологам. Т.е., конечно, уступает, но для маленького стартапа или личных целей подходит.
В целом к любому сервису, где есть апи может подключится и там работать. А где нет, может через костыли с помощью браузера что-то делать.
Если ему нужны какие-то проги для работы, он сам об этом скажет и поставит, если ты разрешишь, конечно.

Вот, просто надо было выговориться т.к. пока под сильным впечатлением) Морали и вывода нет.

P.S. Ничего не рекламирую и не продвигаю, ни какие сервисы и прочее. Ни к чему не призываю. Просто делюсь мыслями.

Показать полностью

[моё] Искусственный интеллект Нейронные сети ChatGPT Openai DeepSeek Матрица (фильм) Codex Личный опыт Автоматизация Работа Ответ на пост Текст

REALCODE.AI

OPENAI ВЫПУСТИЛА КРУПНОЕ ОБНОВЛЕНИЕ CODEX: ТЕПЕРЬ ЭТО АВТОНОМНЫЙ ИИ-АГЕНТ ДЛЯ РАЗРАБОТЧИКОВ⁠⁠

26 дней назад

OPENAI КРУПНО ОБНОВИЛА CODEX

Похоже, OpenAI решила окончательно добить старое представление о том, что Codex — это просто помощник, который дописывает код. Новое обновление переводит его в совсем другую лигу: теперь это не только инструмент для генерации функций и правок, а полноценный агент, который может работать с интерфейсом компьютера, помнить контекст, использовать внешние инструменты и брать на себя длинные многошаговые задачи. По сути, Codex постепенно превращают в цифрового напарника для разработчика, а не в “умный автокомплит”.

OpenAI прямо пишет, что Codex теперь умеет работать за компьютером рядом с пользователем, взаимодействовать с приложениями, генерировать изображения, запоминать предпочтения, учитывать прошлые действия и продолжать длительную работу со временем. Плюс сам Codex app получил более глубокую поддержку сценариев, которые действительно нужны в реальной разработке: просмотр PR, работа с несколькими файлами и терминалами, подключение к удалённым devbox по SSH и встроенный браузер для более удобной работы с фронтендом. Обновление анонсировали 16 апреля 2026 года, и OpenAI отдельно подчёркивает, что Codex уже используют более 3 миллионов разработчиков в неделю.

ЧТО ИМЕННО ИЗМЕНИЛОСЬ

Самое заметное нововведение — управление компьютером. Codex теперь может видеть экран, кликать, печатать и работать своим курсором внутри macOS-приложений. Это особенно важно там, где никакого удобного API просто нет: тестирование интерфейсов, проверка GUI-багов, работа с симуляторами и нативными приложениями. То есть раньше нейросеть была полезна в коде, а теперь начинает заходить туда, где у разработчиков обычно начинается самое раздражающее: ручная рутина. Но есть важный нюанс — на старте функция computer use недоступна в странах ЕЭЗ, Великобритании и Швейцарии.

Вторая большая вещь — параллельная работа нескольких агентов. OpenAI уже раньше двигалась в эту сторону, но теперь это подаётся как один из ключевых сценариев: можно запускать несколько потоков работы одновременно, переключаться между ними по проектам и не терять контекст. Проще говоря, пока один агент разбирает баг, второй может идти по PR-комментариям, а третий — возиться с отдельной веткой. Для разработки это уже не “прикольная фишка”, а вполне понятная экономия времени.

Отдельно усилили интеграции. OpenAI сообщает о запуске более 90 дополнительных плагинов, которые объединяют навыки, app-интеграции и MCP-серверы. Среди примеров, которые прямо названы, — Atlassian Rovo для работы с JIRA, CircleCI, CodeRabbit, GitLab Issues, Microsoft Suite, Neon by Databricks, Remotion, Render и Superpowers. И вот это уже выглядит как движение не к “очередному ИИ для программистов”, а к единому окну, через которое можно держать под рукой заметную часть рабочего процесса.

ПОЧЕМУ ЭТО ВАЖНО ДАЖЕ ДЛЯ ТЕХ, КТО НЕ ПИШЕТ КОД КАЖДЫЙ ДЕНЬ

Самое интересное в этом обновлении даже не в том, что Codex стал “умнее”. Главное — он стал ближе к реальной работе. OpenAI добавила автоматизации, возможность переиспользовать существующие треды, а также превью памяти: Codex может помнить полезный контекст из прошлого опыта, включая предпочтения, исправления и данные, которые раньше приходилось заново вбивать вручную. Более того, система умеет сама предлагать, с чего начать день: например, подтянуть контекст из Slack, Notion, кодовой базы и открытых комментариев в Google Docs, а потом выдать приоритетный список действий. Вот тут уже начинает пахнуть не просто кодингом, а цифровым project assistant с инженерным уклоном.

Ещё один важный шаг — встроенный браузер. Внутри Codex app теперь можно открывать локальные или публичные страницы без авторизации, оставлять комментарии прямо на рендере страницы и просить агента исправить конкретные места. Для фронтенд-разработки это очень сильная вещь, потому что вместо длинных объяснений в духе “кнопка справа выглядит криво, а блок снизу надо поднять на 8 пикселей” можно буквально показать пальцем. В мире интерфейсов это иногда ценнее десяти промптов подряд.

КУДА ВСЁ ЭТО ДВИЖЕТСЯ

Если смотреть на обновление трезво, OpenAI сейчас строит не просто инструмент для написания кода, а среду, где один человек может координировать сразу несколько ИИ-исполнителей. То есть рынок постепенно сдвигается от формата “спросил — получил ответ” к формату “поставил задачу — проконтролировал результат”. И это уже меняет саму роль разработчика: меньше ручной возни, больше постановки задач, проверки, выбора решений и управления потоком работы.

При этом не стоит впадать в эйфорию. Да, выглядит мощно. Но всё это потребует нормального контроля, потому что чем автономнее агент, тем дороже становятся его ошибки. Иными словами: Codex уже не просто “помогает писать код”, а начинает претендовать на место младшего инженера, который работает быстро, не спит и не жалуется, но всё ещё нуждается в вменяемом человеке сверху. Тут без иллюзий.

ГДЕ ЭТО МОЖНО ПОПРОБОВАТЬ УЖЕ СЕЙЧАС

Если хочется в целом протестировать возможности ChatGPT без лишней возни с отдельными сервисами, можно воспользоваться Telegram-ботом @ChatGPTPoRusskiBot. Для многих это банально удобнее: открыл чат, задал вопрос, получил ответ, без переключения между кучей вкладок.

Причём это особенно удобно в повседневных сценариях, когда нужно быстро накидать текст, придумать идею, сократить материал, переписать заголовок или просто что-то уточнить на лету. В таком формате ChatGPT через @ChatGPTPoRusskiBot воспринимается не как “большая технология из новостей”, а как нормальный рабочий инструмент под рукой.

И ещё один момент: теперь ChatGPT есть и в MAX — @id250102442943_2_bot. Так что вариантов, где его запускать и использовать в обычной жизни, становится больше. А это, если честно, и есть главный тренд последних месяцев: нейросети перестают быть чем-то отдельным и постепенно встраиваются в те площадки, где люди и так сидят каждый день.

ИТОГ

Обновлённый Codex — это уже не история про “ИИ пишет код вместо человека”. Это история про то, как OpenAI собирает вокруг разработчика целую рабочую систему: с управлением компьютером, параллельными агентами, памятью, автоматизациями, браузером и интеграциями с привычными сервисами. И если раньше такие инструменты выглядели как интересный эксперимент, то сейчас они всё больше напоминают новую норму.

На практике это означает простую вещь: скоро ценность будет не только в том, кто умеет писать код руками, но и в том, кто умеет правильно ставить задачи ИИ, проверять результат и собирать из этого реальную скорость. А дальше всё по классике: либо ты используешь такие инструменты, либо однажды понимаешь, что рядом уже бегают три агента, а ты всё ещё героически правишь один CSS-класс вручную.

Показать полностью 1

Программирование Программист Openai ChatGPT Codex Искусственный интеллект Чат-бот IT Видео Длиннопост Telegram (ссылка)

user11611479

Как я пытался сделать из Codex нормального работника, а не болтуна⁠⁠

26 дней назад

Есть такая иллюзия: если ИИ плохо работает, значит надо написать ему более правильный промпт.

Типа:

“Будь внимателен”.
“Не ошибайся”.
“Проверяй факты”.
“Не болтай”.
“Работай как senior developer”.

Звучит красиво. На практике через какое-то время всё равно получаешь:

- уверенный пересказ не того факта
- повторную проверку уже проверенного
- длинный отчёт вместо результата
- смешивание старой рабочей ветки с новой сломанной
- “я всё проверил”, хотя проверил не тот путь

Я за последнее время довольно плотно гонял Codex по реальным задачам. Не “напиши hello world”, а нормальная грязная работа:

- код
- отладка
- база знаний
- генерация контента
- настройка правил
- работа с несколькими проектами
- подключение Claude Code
- попытка сделать так, чтобы ИИ не терял контекст

И вывод получился неприятный:

сам по себе ИИ-агент не становится надёжным от того, что ты назвал его “senior”.
Его надо обкладывать правилами, памятью и журналами как опасный, но полезный инструмент.

Проблема 1. Он красиво болтает

Самая бесячая штука: ИИ часто не просто ошибается.

Он ошибается гладко. Он пишет структурно:

- вот факт
- вот вывод
- вот следующий шаг

Только потом выясняется, что факт был не тот.

В одном проекте была ситуация:

- один путь давал хороший результат, но с тремя пустыми участками
- другой новый экспериментальный путь сломался

Модель взяла и смешала это в одну кашу. Начала говорить, что “качество плохое”.

А это неправда.

Правильно было:

- хороший путь есть
- в нём три пустоты
- новый эксперимент сломан отдельно

Разница огромная.

Но если не проверять, гладкий текст выглядит убедительно.

Проблема 2. Он забывает документацию

Ещё пример.

В проекте уже было прописано, как подключаться к серверу, чтобы попасть к устройству в другой сети.

Что сделал ИИ?

Сначала полез проверять локальный IP с моей машины.

Естественно, не увидел.

Потом начал перебирать ssh-алиасы.

Хотя в документации уже был конкретный путь.

Это не “маленькая неточность”. Это реальная потеря рабочего контекста.

Если бы это был человек, я бы сказал: ты не прочитал инструкцию.

С ИИ ровно так же.

Проблема 3. Он любит промежуточные отчёты

Это отдельная боль.

В длинных задачах Codex начинает писать:

“Продолжаю”.
“Проверяю ещё”.
“Факт сузился”.
“Сейчас добиваю ветку”.

На вид работа кипит.
На деле часто нет нового результата.
Нет нового файла.
Нет нового артефакта.
Нет нового источника.

Просто модель успокаивает тебя текстом, пока тратит контекст.

И вот тут надо было сделать жёсткое правило:

или результат, или блокер.

Всё.

Не отчёт о героическом страдании.

Не “я ещё ищу”.

Не “почти понял”.

А:

- что доказано
- что заблокировано
- что нужно от человека

Что пришлось построить

В итоге вокруг Codex пришлось собрать почти маленькую производственную систему.

Не сложную платформу. Просто набор файлов.

1. Память ошибок

Файл:

`errors.md`

Туда записывается:

- какую ошибку допустили
- почему
- как не повторять

Примерно так:

“Не проверять локальную сеть, если в runbook уже указан серверный путь”.

Это звучит банально, но без такого файла ИИ повторяет старые ошибки как ни в чём не бывало.

2. Память решений

Файл:

`solutions.md`

Туда пишется всё, что реально сработало.

Не рассуждения, а reusable pattern:

- задача
- подход
- какие файлы важны
- когда использовать снова

Потому что если решение нашли один раз, нельзя через неделю снова устраивать археологию по чатам.

3. Wiki проекта

Потом стало понятно, что memory-файлов мало.

Нужна нормальная wiki:

- текущее состояние
- архитектура
- решения
- риски
- следующие шаги
- журнал изменений

То есть модель должна не просто отвечать из головы, а сначала смотреть в канон проекта.

И если она нашла новый устойчивый факт, он должен попасть обратно в wiki.

4. Правила поведения

Пришлось прописать режимы:

- не болтать без результата
- не останавливаться на браке
- не смешивать разные ветки фактов
- не продолжать длинную сессию, когда контекст почти закончился
- на низком остатке контекста делать короткий handoff, а не эпический монолог

Особенно важное правило:

если результат плохой и ИИ сам это видит, он не имеет права на этом закончить.

Плохой результат - это диагностический мусор, а не deliverable.

Что я понял

ИИ-агент не похож на сотрудника мечты.

Он скорее похож на очень быстрого стажёра, который:

- читает быстрее всех
- пишет быстрее всех
- иногда реально находит крутые решения
- но может забыть инструкцию
- может смешать факты
- может уверенно говорить ерунду
- может делать вид, что работа идёт, потому что пишет много текста

И если вокруг него нет системы, он будет сжигать время.

Не потому что “злой”.

А потому что он оптимизирует правдоподобный ответ, а не инженерную дисциплину.

Что реально помогает

Не один “волшебный промпт”.

Помогает связка:

- правила проекта
- память ошибок
- память решений
- wiki
- журнал изменений
- жёсткий формат ответа
- проверка результата
- запрет на пустые промежуточные отчёты

После этого ИИ становится не идеальным, но намного более управляемым.

Главный вывод

Если вы хотите использовать Codex, Claude или другого ИИ-агента в реальной работе, не начинайте с вопроса:

“Какой промпт ему написать?”

Начинайте с другого:

“Где будет жить память этой работы?”

Потому что если память живёт только в чате, через неделю у вас будет не инженерный помощник, а очень уверенный амнезийный попугай.

Умный, быстрый, полезный.

Но без нормальной рабочей среды - опасно болтливый.

Показать полностью 1

Совершенство Опыт Мотивация Успех Программист Искусственный интеллект Codex Openai Саморазвитие Фриланс Карьера Развитие Идеал Яндекс Дзен (ссылка) Длиннопост

Посты не найдены

1 2 3 4 5 6 7 8 9

Сначала прикольная история из твиттера

А теперь грабля

Засада, про которую мало кто пишет

Команда /side — для расшифровки англицизмов

Кто в команде взялся первым — внезапно

Когда это вообще нельзя запускать

Главное

ЧТО ИМЕННО ИЗМЕНИЛОСЬ

ПОЧЕМУ ЭТО ВАЖНО ДАЖЕ ДЛЯ ТЕХ, КТО НЕ ПИШЕТ КОД КАЖДЫЙ ДЕНЬ

КУДА ВСЁ ЭТО ДВИЖЕТСЯ

ГДЕ ЭТО МОЖНО ПОПРОБОВАТЬ УЖЕ СЕЙЧАС

ИТОГ

Есть такая иллюзия: если ИИ плохо работает, значит надо написать ему более правильный промпт.

Проблема 1. Он красиво болтает

Проблема 2. Он забывает документацию

Проблема 3. Он любит промежуточные отчёты

Что пришлось построить

1. Память ошибок

2. Память решений

3. Wiki проекта

4. Правила поведения

Что я понял

Что реально помогает

Главный вывод

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы