AI-дебаггеры
AI-дебаггеры? Пока рано.
В фантазиях стартаперов и твиттерских нейронки уже давно пишут код, запускает прод и увольняет джунов пачками. На деле же всё упирается в старую добрую боль — дебаг.
Microsoft Research выкатили debug-gym (GitHub) — песочницу для LLM-агентов, где им дали доступ к настоящим инструментам дебага: брейкпоинты, навигация по репо, чтение переменных, тесты. Всё как у людей. Результат? Максимум — 48.4% успешных фиксов.
Почему?
Потому что у LLM-ов нет того, что делает разработчика разработчиком:
• Контекстное мышление: что делает этот модуль в общей архитектуре?
• Пошаговая логика: "если это не сработало, пойду глубже"
• Память о коде и решениях: "в этом пакете уже был баг год назад"
• Инстинкт инженера: почувствовать, где код сломан, ещё до логов
ИИ пока работает "по обученному паттерну", а не по логике "исследую, нахожу, проверяю".
Микромягкие считает, что решение в интерактивных агентах, которые не просто предсказывают код, а активно ищут информацию, взаимодействуют с системой, задают вопросы. Возможно, один агент будет искать, другой — предлагать решения. Пока это R&D, а не прод.
Дебаггинг — это львиная доля работы любого разработчика. Не генерация функций, не написание шаблонов. А именно ковыряние в баге, чтение логов, отслеживание причин. И ИИ пока не умеет в это.
Это не значит, что ИИ не будет полезен — скорее всего, он станет таким же инструментом, как IDE или линтер. Но до замены программиста ещё далеко. Пока он скорее младший напарник, чем замена.
