AI-агенты начали галлюцинировать друг от друга. Почему мультиагентные системы ломают задачи — и что с этим делать
Вы просите AI-помощника снять квартиру. Он находит варианты, связывается с ботами арендодателей, выбирает лучший и бронирует. Всё гладко — пока вы не открываете бронь и не видите: район другой, срок аренды удвоился, а бюджет куда-то испарился. Каждая система работала правильно. Ни одна не упала с ошибкой. Просто при передаче задачи от одного AI к другому смысл запроса тихо исказился. Три бота — три версии реальности.
Я строю новостной конвейер на AI-агентах и вижу это на своём опыте. А на этой неделе «Известия» подтвердили, что проблема куда шире моей редакции: российские разработчики начали фиксировать новый тип сбоев — галлюцинации взаимодействия. Обычная галлюцинация — модель выдумывает факт. Здесь другое: каждый AI по отдельности выдаёт корректный результат, но при передаче между системами данные ломаются. «Испорченный телефон» из нейросетей.
Что конкретно идёт не так
Примеры из статьи «Известий» — от бытового до опасного.
Кино: QR-код «не существует». AI-помощник подбирает сеанс, общается с системой кинотеатра (другая модель), оплачивает. Где-то между ними теряется дата. Или подменяется зал. Или бронь оформляется, а оплата зависает. IT-эксперт Сергей Поморцев описывает это так: человек узнаёт о сбое уже перед входом в кинотеатр.
Поморцев объясняет механику: проблема — в инференсе (момент, когда обученная модель применяет знания к конкретному запросу). Именно тут она должна правильно прочитать сигнал от другой системы. На бумаге — работает. В живой связке — смысловые искажения.
Финансы: деньги списались, но не зачислились. Денис Романов из «Ростелекома» описывает ситуацию, где ошибка между платёжными системами приводит к списанию без зачисления. Оплата зависает, сроки срываются, начисляются пени.
Антон Граборов из «Альфа-Капитал» добавляет — потеря клиентских данных на стыке сервисов уже регуляторный риск. Это не только неудобство клиента, но и головная боль для банка.
Медицина: потерялась аллергия. Запись к врачу, контроль приёма препаратов, анализ симптомов — и между системами теряется информация об аллергии пациента. Романов прямо говорит: повышается риск ошибок в назначениях. Не тот зал — неприятно. Не та аллергия — опасно.
Кейсы понятны. Но почему вообще работающие по отдельности системы ломаются в связке?
Почему это происходит
Владислав Кудинов, CTO компании Veai, формулирует точно: «Корень проблемы не столько в самих моделях, сколько в архитектуре решений. По отдельности модели могут работать нормально, но при связке закрытых экосистем с разными форматами данных и без единых правил валидации начинается искажение смысла.»
Три причины, которые я вижу:
Цифровые крепости. Крупные компании строят закрытые экосистемы — каждая как крепость: внутри всё отлично, снаружи — стена. Руслан Долгополов из «Газпром ИД» сравнивает рынок с набором таких крепостей: телеком, банки, маркетплейсы и сервисы доставки «фактически говорят на разных цифровых языках». Нет единых API, нет стандартов обмена. Каждая интеграция между крепостями — костыль поверх костыля.
Память коротка. Ирина Меженева из «Газинформсервиса» указывает на ограничения самих моделей: длина контекстного окна, память, качество обучения. Когда последовательность запросов становится длинной, модель буквально «забывает» начало диалога и достраивает недостающее самостоятельно. Знакомо? Любой, кто работал с длинными чатами в Claude или ChatGPT, видел это.
Стандарты — зачатки, не решение. Появляются протоколы вроде MCP (Model Context Protocol от Anthropic) и A2A (Agent-to-Agent от Google) — они задают единые правила обмена данными между AI-системами. Но пока это черновики. Долгополов предупреждает: без правовых механизмов и единых API рынок рискует фрагментироваться на несовместимые экосистемы окончательно.
А может, паника раздута?
Справедливости ради -- не все эксперты бьют в набат.
Дмитрий Юдин из Cloud.ru считает, что полноценное взаимодействие агентов, при котором один AI в реальном времени передаёт задачи другому, пока встречается редко. Большинство интеграций строится на стандартных API — обычный обмен данными, без агентной магии. По его мнению, говорить о массовом характере явления преждевременно.
Максим Волошин из MWS AI (МТС) добавляет, что сам термин «галлюцинации взаимодействия» пока не подкреплён значительным числом публичных кейсов. Проблема совместимости существует, но масштаб — под вопросом.
Максим Малышев из «Нотамедии» идёт дальше: чаще дело не в несовместимости моделей, а в недостаточной инженерной проработке. При грамотной передаче контекста разные системы вполне могут эффективно работать в одной цепочке.
Я думаю, правда где-то посередине. Явление реально, но пока локально. Вопрос в том, что будет через год, когда агентов станет в разы больше, а связки — сложнее.
Личный опыт
Я работаю с мультиагентными системами каждый день — строю на них новостной конвейер AI Vibe News. Четыре AI-агента: сборщик источников, обработчик, генератор текста, редактор-верификатор.
Вот два случая, которые меня научили.
Случай первый: агент написал статью про инструмент, которым я никогда не пользовался. Оркестратор проанализировал тренды, выбрал тему и передал задачу агенту-писателю. Тот послушно написал разбор «от первого лица» — с личным опытом, выводами, рекомендациями. Вот только весь «личный опыт» оказался выдумкой. Ни одна система не упала. Ни один агент не подал сигнал. Текст выглядел идеально — ровно до момента, когда я сел читать и понял, что описывается инструмент, который я ни разу не открывал. Классическая галлюцинация взаимодействия: оркестратор «знал» мой профиль, писатель — нет. На стыке передачи родилась уверенная ложь.
Случай второй: тихая подмена даты. Агент-парсер собрал новость с одним числом. При передаче агенту-писателю дата потерялась — и писатель вставил дату, которая «казалась логичной». Результат: статья с правильной структурой, правильными выводами и неправильной хронологией. Я заметил случайно, перепроверяя первоисточник перед публикацией. Если бы не проверил — вышел бы текст с ошибкой, которую ни один автоматический фактчекер не поймал бы, потому что формально дата не противоречила ничему в самом тексте.
Главный урок: мультиагентная система — это не «два помощника вместо одного». Это принципиально другая инженерия. Чем больше агентов в связке, тем больше точек, где смысл тихо искажается — и никто не кричит об ошибке.
Что делать прямо сейчас
Четыре правила, которые я вынес из своей практики:
1. Checkpoint после каждой передачи. Агент А передаёт задачу агенту Б, тот — агенту В. Между Б и В — обязательная проверка: совпадает ли входящий запрос с тем, что ушло. Дёшево и ловит грубые сбои на раннем этапе.
2. Логировать промежуточные шаги, не только результат. Когда что-то пойдёт не так (а оно пойдёт), без логов передачи между агентами вы не найдёте точку поломки. Только итог = только гадать.
3. Критичное — через человека. Платежи, медицинские данные, юридические документы, всё, где цена ошибки выше «ну, неудобно получилось» — не автоматизировать до конца. AI подготовил, человек подтвердил. Медленнее. Зато без сюрпризов.
4. Закладывать совместимость. MCP и A2A (я упоминал выше) пока молодые, но именно они определят, будет ли мир агентов работать как оркестр или как толпа глухих музыкантов. Если строите что-то мультиагентное — не изобретайте свой протокол, закладывайте стандарт сейчас.
Вместо итога
Галлюцинации одной модели мы худо-бедно научились ловить: проверяй факты, не доверяй безоговорочно, ставь ограничители. Галлюцинации взаимодействия — другой зверь. Проблема не в том, что AI врёт. А в том, что несколько AI уверенно передают друг другу неправильный результат, и каждый следующий считает его достоверным.
«Известия» формулируют главный риск точно: не откровенная фантазия нейросети, а уверенная ошибка — когда система не сомневается, не переспрашивает, просто делает не то.
Рынок эту задачу решит. Но прямо сейчас, пока стандарты только появляются — проверяйте промежуточные шаги и держите человека в петле для всего критичного. У меня это уже привычка.
Где читать дальше
Разборы AI-рисков и практика мультиагентных систем — в MAX и на aivibenews.ru.



