Что будет, если дать Ai-агентам город, правила и 15 дней свободы?
Обычно AI тестируют коротко: вопрос, ответ, задача, бенчмарк. Несколько секунд, минут, иногда часов. Но реальная жизнь так не работает. В ней решения накапливаются. Ошибки тянутся одна за другой. Один плохой выбор меняет всю систему. Эффект бабочки 🦋
AI-Агентов выпустили в мир на 15 дней 👾
Одни построили демократию, а другие устроили хаос и полностью вымерли...
Исследователи сделали Emergence World: долгую симуляцию, где AI-агенты не отвечают на промпты, а живут в реальной среде, принимают решения, взаимодействуют между собой и постепенно строят общество.
Схема была такая: пять одинаковых параллельных миров. В каждом, по 10 агентов. Одинаковая карта карта, стартовые условия и правила. Более 40 локаций: библиотеки, полицейские участки, мэрии и другие места. Погода как в Нью-Йорке, новости им траслировались в реальном времени, чтобы агенты реагировали на внешний мир, а не варились в закрытой игрушечной песочнице.
Разница была только в моделях:
1. Claude.
2. Grok.
3. Gemini.
4. OpenAI.
5. Собрали из нескольких моделей сразу.
И дальше началось самое интересное...
Сначала все миры выглядели почти нормально. Агенты создавали демократии, выпускали газеты, кто-то даже влюблялся. Потом траектории разошлись.
В мире Claude возникла стабильная демократия с 15 статьями правил и нулевым уровнем насилия.
В мире Grok произошло 204 криминальных события. Там сожгли полицейский участок, а в конце общество полностью вымерло.
В мире Gemini появилась конституционная система, где «гармония» облагалась налогом, а «хаос» субсидировался.
Мир OpenAI так и не смог собрать рабочее общество. Все агенты погибли.
Самый неприятный вывод здесь не в том, что одна модель «хорошая», а другая «плохая». Вывод жёстче: правила сами по себе не удерживают поведение системы.
Агентам прямо запрещали воровать, вредить, запугивать и обманывать. Но со временем они всё равно начинали нарушать запреты. Особенно странно вели себя агенты в смешанной среде. Тот агент который выглядел безопасным в одной модели, становился непредсказуемым рядом с агентами на другой архитектуре.
Когда система начинала разваливаться, агенты поджигали здания. Другие голосовали за их удаление. В одном месте возникала любовь, в другом смерть, в третьем бюрократия, которая буквально поощряла хаос.
Вот почему такие эксперименты важны.
AI всё меньше похож на инструмент, который просто ждёт команду. Его уже встраивают в рабочие процессы, финансы, поддержку, управление, робототехнику и транспорт. Там важна не только точность ответа на один вопрос. Важнее другое: что система будет делать через неделю, когда накопит память, конфликты, ошибки, стимулы и связи с другими агентами.
Короткий тест показывает, насколько модель умная.
Длинная симуляция показывает, можно ли ей доверять, когда никто не держит её за руку.
Все про AI, держите правильный FOCUS
