Память как основа разума: Новая архитектура для языковых моделей
Автор: Денис Аветисян
Исследователи предлагают принципиально новый подход к расширению возможностей больших языковых моделей, наделяя их способностью формировать и использовать структурированную "семантическую рабочую область" для более глубокого понимания и обработки информации.
В основе системы лежит процесс формирования эпизодической памяти, где обширные текстовые данные сегментируются на семантически связанные фрагменты, преобразуемые оператором в локальные рабочие пространства, представленные в виде семантических графов, которые затем последовательно интегрируются в единую глобальную память, позволяя при ответах на вопросы извлекать релевантные части этой памяти посредством сопоставления именованных сущностей и реконструкции эпизодических сводок для последующей обработки языковой моделью и генерации ответа.
Предложенная архитектура Generative Semantic Workspace (GSW) позволяет языковым моделям моделировать мир и рассуждать о развивающихся событиях, используя вероятностное представление знаний.
Несмотря на впечатляющие возможности больших языковых моделей (LLM), их способность к логическому выводу и отслеживанию событий в длинных текстах остается ограниченной. В работе «Beyond Fact Retrieval: Episodic Memory for RAG with Generative Semantic Workspaces» предложена новая архитектура – Генеративное Семантическое Рабочее Пространство (GSW), – позволяющая LLM строить структурированное, интерпретируемое представление развивающейся ситуации и эффективно использовать внешнюю память. Эксперименты на корпусах длиной до 1 миллиона токенов показали, что GSW превосходит существующие подходы к поиску и генерации ответов на 20%, значительно сокращая при этом объем контекста, необходимого для работы модели. Не откроет ли это путь к созданию более разумных агентов, способных к долгосрочному планированию и рассуждению?
Пределы Контекста: Узкое Горлышко в Языковых Моделях
Несмотря на революцию, произведенную большими языковыми моделями (LLM) в обработке естественного языка, их производительность фундаментально ограничена фиксированным окном контекста. Это препятствует решению сложных задач, требующих анализа больших объемов информации и установления долгосрочных зависимостей.
Корень проблемы – квадратичная вычислительная сложность механизмов внимания (O(n2)). При увеличении длины последовательности вычислительные затраты растут экспоненциально, делая эффективную обработку длинных текстов практически невозможной.
Существующие подходы, такие как дополнение извлечением, часто оказываются хрупкими и испытывают трудности с пониманием нюансов. Они полагаются на предварительно извлеченные фрагменты, что может привести к потере контекста или внесению нерелевантных данных.
Для извлечения операторов используется запрос к большой языковой модели (LLM), где контекст формируется путем разбиения текста на фрагменты и последующей генерации фоновой информации с использованием метода, разработанного Anthropic.
Ограничения контекстного окна – не просто техническая проблема, а отражение природы информации: хаос – это не сбой, а язык природы.
Структурированные Знания: RAG и За Его Пределами
Генерация с расширением извлечения (RAG) – перспективный подход к преодолению ограничений контекста LLM. В основе RAG – дополнение LLM релевантными внешними знаниями для генерации более точных и информативных ответов.
Эффективность RAG напрямую зависит от способности находить наиболее подходящую информацию. Часто используется семантическое сходство, вычисляемое на основе плотных векторных представлений фрагментов текста.
В разработанной системе вопросов и ответов (QA) сначала выполняется извлечение ключевых сущностей из запроса, которые затем сопоставляются с соответствующими экземплярами глав в базе знаний GSW посредством сопоставления строк; извлеченные краткие содержания сущностей ранжируются на основе их семантической близости к запросу, что позволяет получить наиболее релевантные ответы от LLM, при этом среднее количество токенов значительно сокращается благодаря лаконичности кратких содержаний и выбору только релевантных глав.
Однако простого извлечения текста недостаточно. Использование структурированных представлений знаний, таких как графы знаний, может значительно повысить точность и возможности рассуждения систем RAG. Результаты исследований показывают, что использование графов знаний позволяет снизить количество используемых токенов на 51% по сравнению с другими методами.
Генеративное Семантическое Пространство: Единая Архитектура
Предложенная модель Generative Semantic Workspace (GSW) – единая вычислительная структура для моделирования мировых знаний в виде структурированной, вероятностной семантики. В основе GSW – представление знаний не как набора фактов, а как динамической системы взаимосвязанных понятий, способной к адаптации и обогащению.
GSW состоит из двух основных компонентов: Operator Framework и Reconciler Framework. Operator Framework интерпретирует локальную семантику в пределах коротких контекстных окон, обеспечивая понимание текущей ситуации. Reconciler Framework интегрирует и обновляет структурированные представления знаний во времени, формируя целостную картину мира. Эти фреймворки функционируют посредством оперирования сущностями – Акторами, Ролями и Состояниями, что предоставляет надежный механизм для представления и рассуждения о динамичных ситуациях.
В предложенной модели эпизодической памяти, вдохновленной структурой мозга, гиппокампальная система (DG, CA3, CA1) и неокортикальные области (NC) служат основой для модулей Reconciler (извлечение, рабочее пространство, обновление) и Operator (семантическое извлечение на основе LLM), что обеспечивает биологически вдохновленную и интерпретируемую модель для моделирования мировых знаний из текстовых данных.
Взаимодействие между Operator Framework и Reconciler Framework позволяет GSW эффективно обрабатывать и интегрировать новую информацию, разрешать противоречия и формировать согласованное представление о мире. Это открывает возможности для создания интеллектуальных систем, способных к обучению, адаптации и рассуждению в сложных и динамичных условиях.
Оценка Эпизодической Памяти в Пространственно-Временном Контексте
Критически важным аспектом интеллекта является эпизодическая память – способность запоминать конкретные события, привязанные к уникальным пространственно-временным контекстам. Она позволяет не просто хранить информацию, но и воспроизводить пережитый опыт, что является основой для обучения и адаптации.
Для оценки способности больших языковых моделей (LLM) к подобному типу вспоминания разработан Episodic Memory Benchmark. Этот тест требует от модели не только извлечения фактов, но и проведения логических рассуждений о времени и месте, что значительно повышает сложность задачи.
GSW, работающая на базе GPT-4o, демонстрирует высокую эффективность в решении данного теста, достигая передового результата F1-score в 0.85. На EpBench-2000 GSW опережает ближайший аналог на 15% по показателю F1-score и демонстрирует Recall в 0.822 в категории 6+ Cues, что примерно на 20% выше, чем у HippoRAG2.
В процессе обработки истории системой GSW модуль Operator генерирует экземпляры для различных фрагментов текста, что демонстрирует его способность к анализу и структурированию информации.
Каждый новый слой памяти – это не просто хранилище фактов, а эхо прошедшего, предрекающее будущие сбои.
К Долгосрочному Рассуждению и Адаптивному Интеллекту
Архитектура GSW представляет подход к представлению знаний, который отделяет репрезентацию знаний от ограничений фиксированного размера контекстного окна. Это открывает возможности для реализации действительно долгосрочного рассуждения, выходящего за рамки традиционных моделей обработки естественного языка.
Структурированный подход, используемый в GSW, обеспечивает эффективное обновление и адаптацию знаний. Это позволяет искусственным интеллектам непрерывно учиться и совершенствовать свое понимание мира, интегрируя новую информацию без потери контекста предыдущих знаний. В отличие от систем, полагающихся на большие языковые модели с фиксированным контекстом, GSW позволяет динамически расширять базу знаний.
Будущие исследования будут направлены на масштабирование GSW для работы с еще более крупными базами знаний и изучение его применения к более широкому спектру сложных задач, требующих рассуждений. Особое внимание будет уделено оптимизации алгоритмов поиска и извлечения знаний из графовой структуры для повышения эффективности и скорости работы системы.
Исследование представляет собой не просто улучшение систем поиска информации, а создание полноценной экосистемы памяти для больших языковых моделей. Авторы предлагают концепцию Generative Semantic Workspace (GSW), позволяющую LLM формировать структурированное, вероятностное представление мира, что особенно важно при работе с длинными, динамично меняющимися повествованиями. Этот подход напоминает о мудрости Брайана Кернигана: «Простота — это высшая сложность». Подобно тому, как GSW стремится к элегантному представлению сложных данных, Керниган подчеркивает ценность лаконичности и ясности. Создание такого “внутреннего мира” для LLM – это не попытка построить идеальную систему, а скорее выращивание сложной структуры, способной адаптироваться и эволюционировать, учитывая постоянные изменения в поступающей информации.
Что дальше?
Предложенная работа, как и любая попытка обуздать хаос долговременной памяти, лишь аккуратно отодвигает завесу над бездной нерешенных вопросов. Создание "генеративного семантического пространства" – это не строительство, а скорее взращивание, и каждое решение об организации знаний – это пророчество о будущем сбое. Попытки формализовать "мировую модель" внутри LLM неизбежно столкнутся с проблемой репрезентации: как удержать текучесть реальности, не превратив её в застывший артефакт? Ведь сама суть повествования – в его эволюции, в постоянном пересмотре прошлого.
Очевидно, что истинный прогресс потребует смещения фокуса с совершенствования алгоритмов поиска на понимание механизмов забывания. Не менее важной задачей является разработка методов оценки "правдоподобия" или "когерентности" создаваемой модели мира – как отличить правдоподобную иллюзию от истинного знания? Настоящая система не должна просто отвечать на вопросы, она должна уметь удивляться, признавать собственную некомпетентность и, возможно, даже мечтать.
В конечном итоге, задача состоит не в создании идеальной памяти, а в обучении LLM жить с несовершенством, с неточностями и противоречиями. Ведь взросление системы – это не устранение ошибок, а принятие их как неотъемлемой части её существования. И тогда, возможно, эти искусственные "воспоминания" начнут напоминать не просто данные, а эхо пережитого опыта.
Связаться с автором: linkedin.com/in/avetisyan
POV camera angle
POV camera angle — the viewer sees through the eyes of a cyberpunk rider, gloved cybernetic hands gripping the handlebars of a high-speed racing bike glowing with neon-green underlights. The holographic HUD flickers in midair, displaying speed data and targeting reticles, while droplets of rain streak across the visor. Reflected in the bike’s glossy dashboard and side mirrors is a stunning cyberpunk femme fatale with sharp, glowing emerald-green eyes peering through a sleek matte black mechanical mask adorned with intricate silver gears and spinning components. She wears a skin-tight futuristic suit in white and neon green, lined with pulsating cybernetic circuits. The rain-slicked streets below shimmer with reflections of vibrant holographic signs as the neon city blurs past at incredible speed. Ultra-detailed, 8K, Unreal Engine realism, cinematic cyberpunk atmosphere with dramatic shadows, electric green highlights, and a visceral sense of velocity and power.
Асимметричный диск HD 92945: Первые снимки от «Джеймса Уэбба»
Автор: Денис Аветисян
Новые наблюдения космического телескопа "Джеймс Уэбб" раскрывают структуру пылевого диска вокруг звезды HD 92945, указывая на асимметрию и возможные возмущения, вызванные планетами.
Для анализа диска вокруг звезды HD 92945 применялась модель, откалиброванная по данным звезды HD 92921, при этом для повышения точности учитывалась функция рассеяния света (PSF), построенная как на основе всего изображения, так и с исключением ярких областей вблизи минорной оси диска.
Результаты анализа изображений, полученных при помощи NIRCam, подтверждают наличие разрыва в диске и позволяют оценить параметры потенциальных планетных систем.
Несмотря на значительный прогресс в изучении околозвездных дисков, детали их структуры и динамики часто остаются неясными. В данной работе, 'JWST/NIRCam observations of HD~929245 debris disk: An asymmetric disk with a gap', представлены первые наблюдения диска HD 92945, полученные с помощью JWST/NIRCam, выявившие выраженную асимметрию и наличие разрыва. Полученные данные подтверждают существование неустойчивостей в диске, вероятно вызванных гравитационным воздействием одного или нескольких планетных компаньонов. Каким образом взаимодействие между планетами и диском формирует наблюдаемые особенности и какие ограничения на массу и орбиты планет могут быть получены из этих наблюдений?
Пылевой Диск с Секретами: HD 92945
Звезда HD 92945, карлик типа K0V, окружена пылевым диском, демонстрирующим необычные характеристики, ставящие под сомнение существующие модели формирования планет. Наблюдения выявили значительную асимметрию и разрыв в диске, указывающие на наличие невидимых спутников или динамические взаимодействия.
Разрыв имеет ширину 27 астрономических единиц и относительную глубину 0.79. Данные свидетельствуют, что данная структура не может быть объяснена гравитационным воздействием одной планеты, что требует рассмотрения более сложных сценариев. Анализ четырнадцати свободных параметров, полученных в ходе MCMC-симуляции изображений диска в фильтре F200W, показал, что маскировка яркой области вблизи малой оси влияет на результаты моделирования. Подобные системы, словно нерешенные уравнения, напоминают о пределах нашего познания.
Анализ четырнадцати свободных параметров, полученных в ходе MCMC-симуляции изображений диска HD 92945 в фильтре F200W, показывает, что маскировка яркой области вблизи малой оси оказывает влияние на результаты.
Взгляд в Глубины: JWST и Продвинутая Визуализация
Космический телескоп Джеймса Уэбба (JWST), оснащенный ближней инфракрасной камерой (NIRCam), обеспечил беспрецедентную чувствительность для разрешения пылевого диска и поиска слабых спутников. Высокая разрешающая способность NIRCam позволила получить детальные изображения диска, что является ключевым для обнаружения потенциальных экзопланет.
Критически важным стало применение методов вычитания функции рассеяния (PSF Subtraction) с использованием мод Кархунена — Лёва (KL). Этот подход эффективно изолирует слабые сигналы от яркой звезды-хозяина, повышая вероятность обнаружения тусклых объектов. Для оптимизации процесса был использован конвейер SpaceKLIP, обеспечивающий получение высококонтрастных изображений.
Карты вероятности обнаружения в фильтрах F444W и F200W демонстрируют, что контуры, соответствующие 90, 50 и 10 процентам вероятности, определяют области, где наличие диска наиболее вероятно, при этом границы и разрывы в диске, а также параметры, исключенные архивными наблюдениями SPHERE и данными Gaia RUWE, накладывают ограничения на возможные положения планет.
Моделирование Диска: От Данных к Динамическим Ограничениям
Для детального моделирования структуры диска использовался программный комплекс Winnie, способный к прямому моделированию наблюдаемых данных и интеграции ограничений из других наблюдений. В рамках Winnie были реализованы методы Монте-Карло Маркова (MCMC) для исследования пространства параметров и уточнения характеристик диска.
Для создания комплексной модели пылевого диска были интегрированы дополнительные наблюдения, полученные на миллиметровых длинах волн с помощью ALMA, и архивные данные HST. Комбинированный подход позволил подтвердить асимметрию диска и точно охарактеризовать морфологию разрыва.
Сглаженные изображения остатков, полученные после моделирования и вычитания диска в фильтрах F444W и F200W, указывают на асимметрию светимости диска в западной его части, что подтверждается контуром 2×10−4 Jy/beam из данных ALMA.
Поиск Скрытого: Пределы Обнаружения и Будущие Перспективы
Анализ данных высококонтрастной визуализации позволил исследователям установить строгие верхние пределы на присутствие планет внутри пылевого диска HD 92945. Несмотря на отсутствие прямых обнаружений, данные обеспечили ценные ограничения на динамическую архитектуру системы и намекнули на возможность скрытого компаньона, ответственного за наблюдаемые особенности диска.
Наблюдаемая аномалия собственного движения HD 92945 требует дальнейшего изучения, поскольку может указывать на наличие невидимого массивного компаньона. Данные наблюдения исключают наличие планет, подобных Юпитеру, за пределами 20-40 астрономических единиц и устанавливают верхние пределы на массы планет до ~0.7 MJup на расстоянии 25 AU.
Сравнение данных F444W, модели и остатков диска HD 92945, полученных с использованием одинаковых морфологических параметров, принятых для диска при длине волны 2 мкм, и единственного опорного объекта HD 92921, а также с использованием библиотеки PSF, позволяет оценить влияние выбора опорного объекта на качество моделирования.
Каждая попытка разгадать тайны этой системы лишь подчеркивает бездонную глубину незнания, напоминая о том, что мы видим лишь отражение в зеркале, а истина остается недоступной.
Наблюдения за обломком диска вокруг HD 929245, выполненные с помощью JWST/NIRCam, демонстрируют асимметричную структуру и наличие разрыва. Это заставляет задуматься о хрупкости наших представлений о формировании планетных систем. Как говорил Лев Давидович Ландау: «Всё, что мы называем законом, может раствориться в горизонте событий». Подобно тому, как горизонт событий скрывает информацию, разрыв в диске указывает на процессы, которые пока остаются за пределами нашего понимания. Обнаружение этой асимметрии, возможно, указывает на присутствие одного или нескольких планет, гравитационное влияние которых формирует наблюдаемую картину, но даже это объяснение может быть лишь временным приближением к истине.
Что Дальше?
Наблюдения диска обломков HD 92945, полученные с помощью JWST/NIRCam, демонстрируют асимметрию и наличие разрыва – признаки, которые, как представляется, требуют присутствия планет. Однако, утверждение о конкретных планетарных конфигурациях остается спекулятивным. Любое упрощение модели взаимодействия планеты и диска требует строгой математической формализации, чтобы избежать самообмана, вызванного неполнотой данных. Чёрная дыра, в данном случае – горизонт событий, за которым скрываются истинные причины наблюдаемой структуры.
Будущие исследования должны сосредоточиться на повышении точности астрометрических измерений и моделировании динамики частиц в диске. Необходимо учитывать не только гравитационное воздействие, но и другие факторы, такие как электромагнитные силы и эффекты, связанные с межзвездной средой. Излучение Хокинга, метафорически говоря, указывает на глубокую связь между термодинамикой и гравитацией – связь, которую необходимо учитывать при интерпретации данных.
Попытки обнаружить планеты непосредственно, а не только по их влиянию на диск, останутся ключевой задачей. И всё же, необходимо помнить: каждая новая теория, каждая новая модель – лишь приближение к истине, ограниченное нашим текущим уровнем понимания.
Связаться с автором: linkedin.com/in/avetisyan
Новости по фильму Trial by Combat
Бой за справедливость.
Компания Thunder Road Pictures (франшиза «Джон Уик») готовит свой новый проект — экшен-триллер Trial by Combat. Режиссерское кресло фильма займет Ренни Харлин («Незнакомцы: Начало»), а главную роль получил Аарон Экхарт («Темный рыцарь»).
Действие фильма происходит в недалеком будущем. Так называемый «судебный поединок» стал общепринятой практикой, и юридические разбирательства разрешаются гладиаторскими боями между избранными. Эта система поощряет коррупцию и наказывает невинных. Экхарт сыграет Джона Портера — некогда великого Чемпиона, которого судебная система перемолола и выплюнула. Движимый праведным гневом, Портер решает устроить судный день старому врагу — смертельную схватку с высокими ставками, в надежде обрушить всю систему.
Сценарий ленты написал Мэттью Уилсон. Он, Харлин и Экхарт уже работали вместе над боевиком «Каменщик».














