Серия «Моделирование Роя Биоагентов»

4

Дикая жизнь на матрице пикселей

Серия Моделирование Роя Биоагентов

DevLog: Развитие цифровой жизни. Как нейро-рой учится выживать на фотоматрице.

В прошлых выпусках рассматривался плоский рой биоагентов, который распознавал цифры из набора данных MNIST. Его модель была значительно переписана, чтобы рой мог расти в глубину.

Но, при этом Morphogenetic Neuro-Swarm достиг той фазы, когда сложность системы превысила способность к её интуитивному пониманию и зажила собственной жизнью, которую сложно понять без детального мониторинга. Была создана «живая» цифровая среда, которая начала вести себя непредсказуемо — то вымирая, то взрываясь активностью, то скатываясь в примитивные стратегии выживания.

Это очередная попытка вырастить искусственный интеллект, основанный не на жесткой архитектуре слоев, а на принципах биологической самоорганизации и экономики энергии.

Дальше отчет о текущем статусе эксперимента: концепция, достижения и разбор возникших проблем.


1. Смена парадигмы: От плоского роя к Глубокому Графу

Был совершен концептуальный скачок. Эксперимент перешел от плоской структуры (где каждый агент видит всю картинку) к архитектуре Глубокого Графа (Deep Graph).

В этой модели агент перестает быть только набором весов. Теперь это автономная сущность — «цифровой предприниматель», чья главная цель не классифицировать цифру, а выжить.

Новая анатомия агента

  • Динамические дендриты (отростки): Агент не рождается с готовыми связями. Он их отращивает. Он может подключиться к сенсору (пикселю) или к другому агенту. Так спонтанно возникает глубина сети.

  • Энергетическая валюта: Любое действие имеет цену. Существование — это налог. Отращивание связи — инвестиция. Активация — расход.

  • Экономика перераспределения (Trickle-Down): Вместо обратного распространения ошибки (Backpropagation) используется рыночный механизм. Если агент верхнего уровня (например, детектор цифры «7») получает награду за правильный ответ, он обязан поделиться энергией с теми агентами нижнего уровня, которые подали ему сигнал. Полезные детекторы простых признаков (линий, дуг) выживают, потому что их сигнал «покупают» старшие агенты.

Механизмы саморегуляции

  1. Нейропластичность: Избыток энергии ведет к росту новых связей (поиск источников сигнала). Дефицит энергии заставляет отсекать слабые связи или приводит к гибели агента.

  2. Гомеостаз (Баланс активности): Чтобы агенты не были вечными «молчунами» или, наоборот, не бились в истерике, введен адаптивный порог. Агент стремится быть активным примерно в 5% случаев. Слишком частая активация повышает порог чувствительности, слишком редкая — снижает его.


2. Текущий статус: «Дикий» интеллект

Система работает и эволюционирует. Более 100 поколений агентов подтверждают работоспособность цикла «жизнь — смерть — наследственность».

Что удалось:

  • Выживаемость: Решена проблема мгновенного вымирания. Рой способен восстанавливаться после критических спадов популяции (эффект «бутылочного горлышка»), когда численность падала до нескольких единиц, а затем восстанавливалась до сотни.

  • Эмерджентная глубина: Агенты действительно образуют связи друг с другом, создавая структуры, которые не были запрограммированы явно.

Проблемы (Суровая реальность):

Однако, «жизнь» в матрице пока далека от идеала. Наблюдаются три критических феномена:

1. Проблема «Красного Пятна» (Center Bias) При визуализации областей внимания топ-агентов видны большие красные пятна исключительно в центре поля.

Диагноз: Агенты нашли «хак». В наборе данных MNIST цифры всегда отцентрованы. Самая выгодная стратегия выживания с минимальными усилиями — подключиться к центру изображения. Там всегда есть сигнал («чернила»). Агенты стали детекторами наличия чего-либо, а не детекторами формы.

2. Маниакально-депрессивный Рой (Нестабильность) Система не может найти равновесие, колеблясь между полным молчанием и хаосом.

Итерация 11100: Агентов=60, Активны=0 (Рой молчит) Итерация 12100: Агентов=72, Активны=51 (Рой «кричит» хором)

Гомеостаз работает с запаздыванием. Агенты снижают пороги чувствительности, начинают реагировать на любой шум, получают избыток энергии, бесконтрольно делятся, перенаселяют среду, истощают ресурсы и массово вымирают. Это классические популяционные волны «хищник-жертва», но внутри нейросети.

3. «Черный ящик» (Отсутствие наблюдаемости) Видно, что агенты активны, но непонятна причина. Сформировались ли цепочки «Пиксель -> Линия -> Угол»? Текущих метрик недостаточно. Отладка сложнейшей динамической системы ведется практически вслепую через текстовые логи.


3. План действий: От Хаоса к Структуре

Очевидно, что просто запустить эволюцию недостаточно — необходимо создать правильные ограничения (Constraints), которые направят развитие в сторону интеллекта, а не паразитизма.

Ближайшие шаги:

  1. Тотальная визуализация (Dashboard): Необходим инструмент («рентген»), который в реальном времени покажет граф связей, слои, потоки энергии и топологию. Без этого понимание процессов затруднено.

    • Решение: Создание отключаемой визуализации узлов и связей, а также тепловой карты активаций.

  2. Борьба с «Красным Пятном»: Стратегия простого подключения к центру должна стать невыгодной.

    • Решение: Введение Латерального торможения (Lateral Inhibition). Если два агента смотрят в одну точку и оба активны — они штрафуют друг друга (отнимают энергию). Это заставит их «расходиться» по картинке и конкурировать за уникальные территории и признаки.

  3. Стабилизация экономики: Текущие колебания популяции слишком разрушительны.

    • Решение: Балансировка экономики энергии расхода и поощрения. Агенты не должны умирать мгновенно при первых неудачах, но и жить бесконечно без пользы тоже не могут; требуется более плавная кривая смертности.

  4. Пространственные ограничения: Сейчас агент может подключиться к любому другому агенту, что создает структурную «кашу».

    • Решение: Ограничение связей дистанцией. Соединение возможно только с «соседями». Это принудительно создаст топологические карты, напоминающие структуру коры головного мозга.


Итог

Внутри матрицы MNIST создана модель «жизни». Пока она дикая, прожорливая и не очень умная. Задача разработки — стать «садовником» и направить этот бурный рост в сторону формирования интеллекта целенаправленно решающего задачу классификации.

Код текущей версии роя: GitVerse Link

Следите за обновлениями. В следующих отчетах покажу новые результаты работы "садовника".

Показать полностью
7

Морфогенетический Нейро-Рой / Точность распознавания цифр

Серия Моделирование Роя Биоагентов

Как превратить рой нейронов, кластеризующий образы цифр, в классификатор? Узнайте, как проверить точность классификатора на MNIST, используя принципы биологической эволюции и энергетического баланса!

Мы продолжаем эксперименты с «Морфогенетическим Нейро-Роем».

Первую часть рекомендуется посмотреть, чтобы иметь представление о модели роя:

https://rutube.ru/video/93237fce9666b5d2c6bf0a8c31c677e0/

В прошлый раз автономные агенты научились видеть различия в цифрах, работая как чистый кластеризатор. Но как заставить их не просто группировать данные, а присваивать им конкретные имена — 0, 1, 7?

В этом выпуске мы совершаем ключевой шаг: превращаем «дикий» рой в самообучающийся классификатор без использования традиционного градиентного спуска. Мы используем элегантный метод «Ассоциативного Маркирования», вдохновленный тем, как мозг закрепляет ассоциации.

Что в новой серии:

Концепция Резонансного Маркирования: Как мы калибруем агентов, наблюдая за их победами в конкуренции, чтобы присвоить им метки классов (например, «Детектор Семерок»).

Биологическая Аналогия: Как этот процесс похож на формирование специализированных нейронных групп в живом мозге.

Инференс: Простая и быстрая логика предсказания, основанная на том, какой агент оказался самым сильным в рое.

Взгляд в Будущее: Анонс следующего этапа — внедрение вертикального роста и локального зрения, что приблизит наш рой к архитектуре CNN.

Если вы интересуетесь нейроморфными вычислениями, самоорганизующимися системами или ищете альтернативы стандартному машинному обучению, этот выпуск может быть вам интересен. Смотрите, как хаос превращается в высокоточный порядок!

Код модели: https://gitverse.ru/Nikas/NeuralNet.2025/content/master/mani...

Показать полностью 1
11

Цифровые бактерии учатся узнавать цифры на фото

Серия Моделирование Роя Биоагентов

Сегодня будем обучать нейросеть. Но не ту, что с миллионами слоев и градиентным спуском, который вечно норовит увести нас в локальный минимум. Нет. Мы будем использовать Морфогенетический Нейро-Рой.

Звучит как название плохого фантастического фильма? Возможно. Но суть в том, что мы имитируем биологию, чтобы решить задачу, которую обычно решают чистой математикой.

Пассмотрим цифровую чашку Петри. В ней живут сотни крошечных, голодных, но очень целеустремленных BioAgent’ов. Их цель? Выжить. А еда? Рукописные цифры из классического датасета MNIST.

Да, мы заставим этих цифровых бактерий эволюционировать, чтобы они научились отличать «семерку» от «единицы». И это — без единого намёка на градиентный спуск!


Анатомия Цифровой Бактерии: Геном и Совесть

Наш главный герой — BioAgent. Это не просто нейрон. Это, по сути, одноклеточный организм, у которого есть:

  1. Геном (W): Вектор весов размером 784. Это его «мысленный образ» того, как должна выглядеть идеальная цифра. В начале они слепы, веса инициализированы около нуля (типичный «Темный старт»).

  2. Энергия (E): Валюта жизни. Угадал цифру — поел. Не угадал — плати за метаболизм. Классика капитализма, только в мире пикселей.

  3. Привыкание (H): Вот тут начинается самое интересное. Это наша «цифровая совесть». Если агент слишком часто побеждает и жрёт, он «устаёт». Его чувствительность падает. Он становится ленивым и должен уступить дорогу молодым и голодным.

Ирония: Мы ввели в модель нечто, что заставляет самых успешных агентов замедляться. Потому что в реальной жизни, если ты слишком долго сидишь на одном месте, тебя съедает конкурент.


Подготовка Среды: Включаем Свет в Многомерном Пространстве

Прежде чем выпустить рой на охоту, нужно подготовить поле боя. Если просто скормить агентам сырые пиксели MNIST, они будут барахтаться в шуме.

Мы делаем трюк с предобработкой: центрирование данных.

X{input} = \frac{X{raw}}{||X{raw}||} - X{mean}

Что это значит на пальцах? Мы вычитаем из каждого изображения «среднюю картинку» всего датасета.

Представьте, что вы смотрите на кучу фотографий. Мы убираем из каждой из них общий фон и среднюю яркость. В результате, то, что было нулем (фоном), становится отрицательным (синим на визуализации), а сама цифра — положительной (красной).

Эффект? Векторы разных цифр становятся ортогональными. Они смотрят в совершенно разные стороны в 784-мерном пространстве. Для наших агентов это как если бы кто-то включил свет в тёмной пещере. Цифры стали выпуклыми и легко различимыми.

Цикл Жизни: 4 Фазы Эволюции (Без Учителя!)

Когда в среду попадает новая цифра X, запускается четырёхфазный цикл, который заменяет нам весь наш любимый градиентный спуск.

Фаза I: Восприятие и Штраф за Жадность

Каждый агент смотрит на X и считает свой Score. Но это не просто сходство. Мы вводим штраф за «привыкание» (H):

Score = (W X) - (beta H)

Если ты недавно много ел (высокий H), твой Score искусственно занижается. И ты не можешь просто так забрать всю еду. Конкуренция с совестью. (Или форма закона сохранения энергии, когда даже самое большое чудище, сидящее на ресурсе, не может одинаково легко и быстро расти бесконечно)

Фаза II: Питание и Эволюция (Правило Хебба в действии)

Победитель (максимальный Score) получает жирный кусок энергии (E \leftarrow E + R_{feed}). И тут же учится по правилу Хебба: «Neurons that fire together, wire together».

W{new} = W{old} + \eta (X - W_{old})

Он подтягивает свой геном к увиденному образу. Причем учатся и ближайшие соседи (Top-2, Top-3), но слабее. Так рождаются «банды» агентов, специализирующихся на одной и той же цифре, но с разными стилями написания.

Фаза III: Метаболизм (Естественный Отбор)

За всё надо платить. E \leftarrow E - E_{cost}. Если агент не смог найти свою нишу и не заработал достаточно, он умирает от голода (Апоптоз). Жестоко? Да. Эффективно? Ещё как!

Фаза IV: Динамика Популяции (Митоз)

Если агент накопил слишком много энергии (E > E_{threshold}), он делится. Но это не просто копирование!

  1. Родитель отдает потомку половину энергии и веса с небольшой мутацией.

  2. Ключевой момент: У родителя H высокий (он устал). У потомка H = 0.0 (он свежий, голодный и очень чувствительный).

  3. Пока родитель «отдыхает» и ждет, пока его H спадет, потомок тут же бросается в бой, чтобы уточнить специализацию. Например, если родитель узнавал «восьмерку» с наклоном вправо, потомок может начать специализироваться на «восьмерке» с наклоном влево. Рой сам заполняет все возможные вариации данных!


Взгляд в Бактерии: Что там внутри?

Давайте посмотрим на результат. Перед нами снимок популяции выживших агентов после первой эпохи. (После показа системе 5000 изображений)

Цифровые бактерии учатся узнавать цифры на фото

Помните про центрирование? Посмотрите на цвета в весах агента (например, G8 W65 — Агент 8-го поколения, 65 побед).

  • Красные/Желтые зоны: Возбуждение. Агент ожидает увидеть здесь чернила цифры.

  • Синий фон: Торможение. Агент ожидает увидеть здесь пустоту.

  • Этот агент — не просто набор чисел. Это фильтр, который настроен на конкретный паттерн. Если входящий пиксель совпадает с красным, а фон — с синим, происходит резонанс, и агент получает энергию. А рядом с ветеранами (W65) вы видите «шумных» новичков с W0. Они либо умрут в следующем цикле, либо найдут свою уникальную нишу, которую еще не заняли доминирующие кластеры.


Выводы: Эволюция лучше, чем градиент?

Почему этот Морфогенетический Нейро-Рой смог распознать цифры без всякого учителя?

Секрет в балансе:

  1. Конкуренция за ресурсы (Энергия).

  2. Механизм усталости (H), который не дает одному агенту монополизировать нишу.

  3. Биологическое размножение с обнулением «совести» у потомства, что обеспечивает постоянное исследование новых вариаций.

  4. Мы не учили систему, что такое «цифра 2». Мы просто создали среду, где выживание зависело от способности находить и уточнять уникальные паттерны в данных.

Мораль: Иногда, чтобы создать интеллект, нужно просто дать ему возможность проголодаться и заставить конкурировать за еду.

Если хотите посмотреть, как это всё работает в коде, загляните по ссылке: https://gitverse.ru/Nikas/NeuralNet.2025/commit/5075d6f248b2...

Что дальше?

Поле непаханное того, что можно сделать:

  1. Разобраться как элегантно из кластеризатора сделать классификатор.

  2. Определить точность с которой эта система классифицирует MNIST и скорость сходимости.

  3. Вертикальный рост (в глубину). Можно создать агентов, которые смотрят не только на пиксели, а на агентов нижних слоев, исследуют глубинные архитектуры и пытаются найти такую топологическую конфигурацию, которая будет стабильно выживать.

  4. Петлевые агенты (обратной связи) - которые смотрят на глубокие слои, находясь в нижних слоях.

  5. Вариации на CNN. Ограничивать количество рассматриваемых агентом пикселей (чтобы он видел не всю матрицу, а только какую-то часть) Будет эффективнее по памяти и сможет находить более низкоуровневые фичи, чем готовые цифры.

  6. Когда все предыдущее заработает можно поробовать классифицировать ImageNet

Увидимся в новой симуляции!

Показать полностью 1
3

Модель адаптивного Роя в задаче Консенсуса плотности

Серия Моделирование Роя Биоагентов

Как рой агентов находит истину без главного? 2500 простых программных единиц достигают 100% консенсуса, используя только локальные сплетни!

Вы когда-нибудь задумывались, как стая птиц или муравьиная колония принимают коллективные решения без единого лидера?

В этом видео мы погрузимся в мир распределенных систем и смоделируем, как рой агентов, видящих только своих ближайших соседей, может решить задачу консенсуса. Мы откажемся от градиентных спусков и вместо этого применим принципы, вдохновленные нейрофизиологией — Обучение Хебба.

Вы этом выпуске:

  • Механика "Роя": Как бинарные агенты (Черный/Белый) принимают решения, основываясь на взвешенном мнении соседей.

  • Самообучение: Увидите, как агенты динамически меняют "доверие" (веса) к другим, усиливая связи с теми, кто прав, и игнорируя "шум".

  • Фазовый переход: Наблюдайте в реальном времени, как хаос (51% консенсуса) превращается в абсолютный порядок (100%) через лавинообразный процесс.

  • Устойчивость: Почему децентрализованные системы самоисцеляются и как они справляются с "дефектными" агентами, чего не всегда удается добиться в централизованных моделях.

Здесь не только теория — но и запуск симуляции на сетке 50x50, где мы проследим хронологию победы коллективного разума. Если вам интересно, как простые локальные правила порождают сложное, адаптивное и устойчивое поведение - смотрите видео.

Код модели можно посмотреть здесь
В том же каталоге текстовая затравка (spec.txt) для генерации кода анимации и сам сгенерированный код анимации.

Показать полностью
Отличная работа, все прочитано!

Темы

Политика

Теги

Популярные авторы

Сообщества

18+

Теги

Популярные авторы

Сообщества

Игры

Теги

Популярные авторы

Сообщества

Юмор

Теги

Популярные авторы

Сообщества

Отношения

Теги

Популярные авторы

Сообщества

Здоровье

Теги

Популярные авторы

Сообщества

Путешествия

Теги

Популярные авторы

Сообщества

Спорт

Теги

Популярные авторы

Сообщества

Хобби

Теги

Популярные авторы

Сообщества

Сервис

Теги

Популярные авторы

Сообщества

Природа

Теги

Популярные авторы

Сообщества

Бизнес

Теги

Популярные авторы

Сообщества

Транспорт

Теги

Популярные авторы

Сообщества

Общение

Теги

Популярные авторы

Сообщества

Юриспруденция

Теги

Популярные авторы

Сообщества

Наука

Теги

Популярные авторы

Сообщества

IT

Теги

Популярные авторы

Сообщества

Животные

Теги

Популярные авторы

Сообщества

Кино и сериалы

Теги

Популярные авторы

Сообщества

Экономика

Теги

Популярные авторы

Сообщества

Кулинария

Теги

Популярные авторы

Сообщества

История

Теги

Популярные авторы

Сообщества