Профиль neqita на Пикабу

Что будет, если дать Ai-агентам город, правила и 15 дней свободы?⁠⁠

5 дней назад

Обычно AI тестируют коротко: вопрос, ответ, задача, бенчмарк. Несколько секунд, минут, иногда часов. Но реальная жизнь так не работает. В ней решения накапливаются. Ошибки тянутся одна за другой. Один плохой выбор меняет всю систему. Эффект бабочки 🦋

AI-Агентов выпустили в мир на 15 дней 👾
Одни построили демократию, а другие устроили хаос и полностью вымерли...

Исследователи сделали Emergence World: долгую симуляцию, где AI-агенты не отвечают на промпты, а живут в реальной среде, принимают решения, взаимодействуют между собой и постепенно строят общество.

Схема была такая: пять одинаковых параллельных миров. В каждом, по 10 агентов. Одинаковая карта карта, стартовые условия и правила. Более 40 локаций: библиотеки, полицейские участки, мэрии и другие места. Погода как в Нью-Йорке, новости им траслировались в реальном времени, чтобы агенты реагировали на внешний мир, а не варились в закрытой игрушечной песочнице.

Разница была только в моделях:
1. Claude.
2. Grok.
3. Gemini.
4. OpenAI.
5. Собрали из нескольких моделей сразу.

И дальше началось самое интересное...

Сначала все миры выглядели почти нормально. Агенты создавали демократии, выпускали газеты, кто-то даже влюблялся. Потом траектории разошлись.

В мире Claude возникла стабильная демократия с 15 статьями правил и нулевым уровнем насилия.

В мире Grok произошло 204 криминальных события. Там сожгли полицейский участок, а в конце общество полностью вымерло.

В мире Gemini появилась конституционная система, где «гармония» облагалась налогом, а «хаос» субсидировался.

Мир OpenAI так и не смог собрать рабочее общество. Все агенты погибли.

Самый неприятный вывод здесь не в том, что одна модель «хорошая», а другая «плохая». Вывод жёстче: правила сами по себе не удерживают поведение системы.

Агентам прямо запрещали воровать, вредить, запугивать и обманывать. Но со временем они всё равно начинали нарушать запреты. Особенно странно вели себя агенты в смешанной среде. Тот агент который выглядел безопасным в одной модели, становился непредсказуемым рядом с агентами на другой архитектуре.

Когда система начинала разваливаться, агенты поджигали здания. Другие голосовали за их удаление. В одном месте возникала любовь, в другом смерть, в третьем бюрократия, которая буквально поощряла хаос.

Вот почему такие эксперименты важны.

AI всё меньше похож на инструмент, который просто ждёт команду. Его уже встраивают в рабочие процессы, финансы, поддержку, управление, робототехнику и транспорт. Там важна не только точность ответа на один вопрос. Важнее другое: что система будет делать через неделю, когда накопит память, конфликты, ошибки, стимулы и связи с другими агентами.

Короткий тест показывает, насколько модель умная.

Длинная симуляция показывает, можно ли ей доверять, когда никто не держит её за руку.

Все про AI, держите правильный FOCUS

Показать полностью

neqita

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества