AI-помощник для кода (Cursor, Codex, Claude Code) при поиске по проекту тупо читает кучу файлов подряд — жрёт токены пачками и всё равно мажет. Лечится «графом кода»: это как оглавление вместо листания всей книги. Разобрал две тулзы — CodeGraph (лёгкий, гоняю сам) и Graphify (тяжёлый, про всё сразу). Обе бесплатные, к обеим отношения не имею.
Короче. Если ты пользуешься AI для кода — Cursor, Codex, Claude Code, неважно — ты наверняка ловил вот это. Даёшь ему задачу попроще: «найди, где тут проверяется логин, и поправь». А он начинает… искать. Открывает один файл целиком. Потом второй. Потом ещё пятнадцать. Перечитывает полпроекта, чтобы понять, что с чем связано.
И вот тут две беды сразу. Первая — он сжигает токены вагонами. На большом проекте один такой поиск — это сотни тысяч токенов только на то, чтобы понять, где вообще лежит ответ. А подписки сейчас и так глючат и режут лимиты так, что плакать хочется. Вторая беда — он ещё и мажет. Прочитал не те файлы, сделал вывод на половине, пошёл чинить не там. И ты сидишь, смотришь на это, и думаешь: ну ты чего, тупой, что ли?
Не тупой. Просто ищет по-дурацки.
Объясняю на пальцах, без задротства
Представь книгу на тыщу страниц. Тебе надо найти слово «авторизация». Можно листать страницу за страницей и читать всё подряд — найдёшь, но к вечеру и с дёргающимся глазом. А можно открыть оглавление (или предметный указатель в конце) и за пять секунд понять, где оно.
Вот AI без всякой подготовки делает первое — листает всю книгу. Каждый раз заново. А «граф кода» — это как раз то самое оглавление. Специальная программа один раз пробегает по всему проекту и строит карту: какие есть функции, какие классы, кто кого вызывает, кто откуда что тащит. И складывает это в маленькую базу.
Дальше AI не перечитывает двадцать файлов. Он спрашивает у карты: «кто вызывает функцию проверить_токен?» — и получает точный ответ мгновенно. Один запрос вместо двадцати чтений. Кто работал с базами данных — это ровно как индекс: можно тупо перебирать миллион строк, а можно построить индекс и доставать за миллисекунды. Идея старая как мир, просто к AI её прикрутили недавно.
Что я гоняю сам — CodeGraph
Я сижу в основном в Codex, и поставил себе штуку под названием CodeGraph. Она ровно про это: строит лёгкую карту кода, целиком у тебя на компе, никуда ничего не отправляет. Поставил, она один раз проиндексировала проект — и дальше AI ходит в карту вместо того, чтобы листать файлы.
Честно расскажу про главную засаду. Поставить — не проблема, пара команд. Проблема была заставить агента реально пользоваться этой картой, а не игнорировать её и по привычке лезть листать файлы. Он, зараза, как студент: ему сказали «есть оглавление», а он всё равно открывал книгу с начала. Пришлось повозиться с настройками и отдельно прописать ему инструкцию: сначала смотри в карту, потом уже всё остальное. Вот после этого заработало как надо.
Стало ли лучше? Субъективно — да, заметно. AI перестал лазить в десяток лишних файлов, отвечает быстрее и точнее. Но честно скажу сразу, чтобы потом не было «а где пруфы»: своих замеров я не делал. По ощущению — кайф, но циферку нарисовать не могу. У авторов в их тестах заявлено что-то вроде −57% токенов и −70% обращений к файлам. Это их цифры на их проектах, я лично не перепроверял. Но по ощущениям порядок похож на правду — когда двадцать чтений схлопываются в один запрос, экономия реально большая.
А есть ещё Graphify — и это про другое
Тут многие путаются, поэтому держи. Есть вторая тулза, Graphify, и на первый взгляд кажется «то же самое». А вот фиг.
CodeGraph — это лёгкий индекс только кода, для скорости. А Graphify строит карту всего проекта: не только код, но и документацию, PDF-ки, картинки, даже видео. То есть он не столько ускоряет AI в ежедневной работе, сколько помогает въехать в проект целиком — особенно если проект чужой или старый, и знание размазано по коду и куче документов. На выходе даёт даже красивую интерактивную картинку-граф, по которой видно, что с чем связано.
Я его пока только собираюсь попробовать, вживую не гонял — врать не буду. По докам разобрался в одной важной штуке: сам код он, как и CodeGraph, разбирает бесплатно, у тебя на компе. Платишь токенами только за документы и картинки — их он скармливает нейросети, чтобы вытащить смысл. И что приятно: если запускать его прямо изнутри своей IDE, отдельный платный ключ не нужен — он берёт модель из твоей же подписки. А если документы тебе не нужны, можно сказать ему «работай только по коду» — и тогда он вообще ничего не тратит, превращаясь по сути в тот же CodeGraph.
Где я знатно облажался — с хранением
Вот тут отдельная история, на которой я набил шишку. Я работаю с нескольких компов и часто с командой. И первая мысль была логичная: раз карта полезная — давай положу её в общее место, в облако или в гит, чтобы у всех была и не пересобирать каждому.
У CodeGraph эта карта лежит в файле базы (SQLite), а такие файлы на сетевых дисках и особенно в WSL2 любят залипать в блокировках — у них это даже в известных багах записано. Плюс бинарный файл в гите — это конфликты при каждом коммите и распухшая история. Я потыкался и понял простую вещь: эту карту вообще не надо никуда таскать. Она строится из кода за секунды. Источник правды — это сам код. Каждый у себя на компе один раз сказал «построй» — и всё, дальше она сама обновляется. Синхронизируешь код, а не карту. Никаких блокировок, никакой боли.
А вот у Graphify наоборот — его карта это обычный текстовый файл, и авторы прямо советуют закоммитить его в гит, чтобы команда пользовалась готовым. Потому что построить его дорого (токены же). Логика разная, потому что и тулзы про разное.
Если коротко — кому что
CodeGraph — если бесит, что AI жрёт токены и тупит при поиске по коду. Лёгкий, локальный, поставил и забыл. Рабочая лошадка на каждый день.
Graphify — если надо въехать в незнакомый или старый проект целиком, со всей документацией, и посмотреть на него «сверху». Инструмент понимания, а не скорости.
И да, мир на этих двух не сошёлся. Есть ещё пачка похожих штук — Gortex (помощнее, тащит сразу кучу репозиториев и 256 языков), Sourcegraph (это уже для больших контор с сотней репозиториев, и он платный), Cognee (а вот это вообще не про поиск кода, а про «долгую память» AI — другая тема). Но если ты только начинаешь — не парься, начни с CodeGraph, его за глаза.
Честно: где это НЕ нужно
Не буду продавать тебе мечту. Если у тебя проект на три файла — забей, никакая индексация не нужна, AI и так всё найдёт мгновенно. Вся эта история начинает иметь смысл, когда проект большой и AI реально тонет в нём. На мелочи ты только время потратишь на настройку.
И вторая честность: я не делал строгих замеров. Всё, что я говорю про «быстрее и точнее» — это мои ощущения на моих проектах. Может, у тебя стек другой и зайдёт хуже. Попробуй на кошке, прежде чем тащить в боевой проект.
А теперь спорное, можете кидать панамку
Мне постоянно пишут: «Да зачем тебе эта индексация, если у тебя подписка дорогая и токенов вагон? Не выпендривайся, пусть AI листает как листал».
Так вот — дело вообще не в токенах. Точнее, не только. Главное — AI с картой находит нужное с первого раза, а не читает двадцать файлов и гадает на половине. Он реже мажет. А значит — я реже за ним переделываю и реже сижу проверяю. Я экономлю своё время и получаю результат лучше. Токены, которые при этом тоже экономятся — приятный бонус, но не главное.
Отказываться от этого, потому что «токенов и так хватает» — это как сказать «у меня сервер мощный, зачем мне индексы в базе». Ну хватает, да. Просто можно сделать быстрее, точнее и дешевле разом. Не вижу ни одной причины этого не делать.
Важно! (а то щас набегут)
Звучит как реклама CodeGraph? Понимаю. Но я к нему вообще никакого отношения не имею — это чужой опенсорс, бесплатный, мне просто зашло. Я тут ничего не продаю и денег с этого не имею. Не веришь — так и не надо, поставь сам да проверь, благо бесплатно.
Ссылки на обе тулзы, готовые промпты, которыми их ставишь (копируешь в своего AI-агента — он сам разворачивает инструмент и прописывает себе правило лезть в карту, а не листать файлы), и до кучи мой маленький setup-skill graphify-project — не вместо стандартного, а в довесок. У самого Graphify уже есть огромный runtime-skill, который сам ставится командой graphify install — он гоняет всю боевую работу. Мой делает другое: помогает один раз правильно установить Graphify в репо без боли, если у тебя нет gcc на машине (внутри fallback на zig-cc), и не даёт агенту втихую сжечь токены через внешний backend. Всё это кидать сюда не буду — Пикабу ссылки не любит, да и забанит ещё. Сложил в свою телегу: t.me/maslennikovigor. Кто реально пробовал Graphify на боевом — напишите в комменты, мне правда интересно, я-то его ещё не гонял. А если хочешь поспорить или спросить — я в личке @maslennikovig, отвечаю сам, не бот.