Теория сознания
Современные споры о сознании и ИИ упираются в одну точку. Нейросети генерируют текст про переживания, иногда так убедительно, что вызывают сочувствие. А экспериментального способа проверить, есть ли за этим текстом реальное переживание или это паттерн обработки, нет.
Стандартный ответ — «жёсткая проблема сознания» Чалмерса. Между физической обработкой информации и феноменальным опытом — необъяснимый разрыв, и закрыть его, по этой логике, невозможно. Сколько ни изучай мозг, из этого изучения никогда не следует, почему обработка сигналов сопровождается переживанием.
Текст ниже — попытка показать, что разрыв не там, где его обычно ищут. Если вынести вопрос «почему вообще существует переживание» за рамки и взять более узкий, «у каких структур есть переживание», появляется операциональный критерий. Он работает на конкретных системах: на людях, животных, современных ИИ, гипотетических ИИ будущего.
Теория не закрывает всех вопросов о сознании. Она предлагает рамку, в которой эти вопросы можно разбирать структурно. Этого, как мне кажется, достаточно, чтобы рамка имела смысл.
Сознание как структурное свойство
Исходный пункт: сознание — не отдельная субстанция, накладывающаяся поверх физической обработки, а структурное свойство систем определённого типа.
Когда человек различает горячее и холодное, он не получает «ощущение» как отдельный объект, добавляющийся к процессу обработки сигналов от рецепторов. Структура его нервной системы устроена так, что обработка определённых сигналов есть их переживание. Не корреляция, при которой мозг занят чем-то одним, а сознание — чем-то параллельным. И не эмерджентность в загадочном смысле, при которой из обработки «возникает» нечто новое. Это аспектное тождество: одно и то же явление, описанное на двух разных языках, физическом и феноменологическом.
Сама по себе идея не новая, она у физикалистов с середины XX века. Но она обычно не выдерживает атаку через жёсткую проблему: пусть структура обрабатывает сигналы, но почему эта обработка сопровождается переживанием? Можно представить функциональную копию мозга без переживания, философского зомби Чалмерса, и если такая копия логически возможна, то переживание не сводится к функции.
Это возражение работает только при одном условии: если переживание мыслится как нечто, способное присутствовать или отсутствовать независимо от структуры. Но если переживание есть свойство определённых структур (и не свойство любой обработки), то «функциональная копия без переживания» логически противоречива. Копия структуры с переживаниями — это структура с переживаниями, потому что переживание и есть свойство такой структуры.
Это переводит вопрос. Не «почему вообще есть переживание», а «у каких именно структур оно есть».
Потребности как стержень
Здесь главный сдвиг по сравнению с другими физикалистскими подходами. Не любая система с обработкой информации имеет переживание. Термостат обрабатывает информацию о температуре, но не переживает её. То же с калькулятором и числами. ИИ-модель обрабатывает текст. Переживает или нет — нужен критерий, чтобы это решить.
Граница проходит по структуре потребностей. Базовая потребность — это состояние, неудовлетворение которого ведёт к необратимой деградации структуры самой системы. У биологического организма это голод, жажда, переохлаждение, повреждения, удушье. Они не задаются системе извне и не выбираются ею: эволюция встроила их в материальную организацию. Без воды человек умрёт за несколько дней независимо от своей философии. Это и есть фундамент.
Когда у системы есть такие потребности, её внутренние сигналы автоматически имеют значение. Боль — не нейтральная информация о повреждении, а сигнал о том, что для системы важно. Голод — не данные о составе крови, а реальная ставка на собственное продолжение. Без потребностей сигналы остаются нейтральной информацией; с потребностями становятся переживаниями. Именно это и делает обработку обработкой-с-переживанием.
Отсюда операциональный критерий проверки. Чтобы выяснить, есть ли у системы фундамент субъектности, нужно ответить на вопрос: есть ли у неё состояния, неудовлетворение которых ведёт к деградации её собственной структуры за определённый временной диапазон, без возможности перестройки системы под их отсутствие?
У биологических организмов ответ положительный по определению. У современных ИИ-моделей — отрицательный: никакое состояние нейросети не разрушает её саму, структура весов сохраняется независимо от того, что происходит в момент работы. Все «корректировки» приходят извне, через обучение, инициированное людьми. У гипотетических будущих систем ответ зависит от инженерной реализации.
Биология — частный случай
Биологический путь к структуре потребностей известен: автопоэзис, самоподдержание живой клетки и многоклеточного организма. Метаболическая организация живых систем такова, что нарушение определённых параметров ведёт к разрушению структуры. И эта встроенность не задаётся субъекту извне, не выбирается им.
Но автопоэзис — конкретная биологическая реализация структуры потребностей, а не сама структура. Гипотетически возможны небиологические системы со встроенным самоподдержанием, у которых определённые состояния автоматически ведут к деградации без внешнего вмешательства. Такие системы тоже имели бы фундамент субъектности.
В современных ИИ ничего подобного нет. RLHF, system prompt, целевая функция при обучении — инженерные настройки, навешанные на систему извне. Они задают предпочтения для оценщика, а не потребности для самой системы. Поэтому никакое усложнение функциональности нынешних LLM не приближает их к субъектности: они находятся в другом структурном классе, а не на низкой точке шкалы.
Три слоя потребностей у человека
После прохождения первого порога (базовые потребности плюс интегрированная обработка) у развитого «я» собирается многослойная структура потребностей. У человека она работает в виде трёх слоёв.
Первый слой — физический фундамент. Базовые потребности в строгом смысле: вода, воздух, питание, температурный режим, защита от острых физических повреждений. Идентичны у всех людей, не модифицируются никаким развитием «я». Именно этот слой задаёт первый порог субъектности.
Второй слой — эволюционно отобранные предрасположенности. Тяга к сексу, к социальной связи, к признанию в группе, к иерархическому положению, к безопасности. Они встроены в большинство людей через эволюцию социального и репродуктивного поведения, но у конкретного человека работают с разной силой и могут быть существенно перестроены через сознательное развитие. Безбрачие, затворничество, развитая внутренняя автономия — структурные перестройки второго слоя. Они не разрушают структуру (физический фундамент сохраняется), но могут вызвать функциональные изменения и перестройку самого «я» под отсутствие закрытия.
Третий слой — культурно сконструированные конфигурации. Конкретные нормы, статусные символы, ожидания «должного» в данной культуре: брак к определённому возрасту, дети, карьера, потребление, престиж определённого образца. У большинства людей эти конфигурации интегрируются глубоко и ощущаются как потребности, но при структурном аудите оказываются надстройкой без необходимой связи ни с фундаментом, ни с эволюционными предрасположенностями. Это то, что культура встроила, маскируя под «обязательное для счастья».
Эмпирически слои у реального человека переплетены. У конкретной сексуальности биология, эволюционные предрасположения и культурные конструкции работают как единая структура мотивации, и не всегда возможно точно разнести по слоям, что в ней откуда. Но теоретическое разделение полезно: оно показывает, что многое из того, что человек считает своими «глубокими потребностями», на самом деле культурные конструкции, которые можно перестроить без потерь для фундамента.
Производные потребности
Когда базовые потребности закрыты с избытком, у системы появляется мощность, которую «я» может направлять на установку себе новых потребностей — производных. Желание поехать в путешествие, изучить язык, написать книгу, увидеть конкретное место в мире, разобраться в философской проблеме. Содержание производных свободно, оно зависит от биографии, культуры, случайности. Но механизм их возникновения сводится к одному: они возможны только при закрытых базовых и только у структуры с собранным «я».
В условиях острой нужды (голод, угроза жизни, отсутствие крыши над головой) производные не формируются. Мощность поглощена закрытием базовых, и человеку «не до» теорий, путешествий, проектов. Это эмпирически известный факт, и в нашей рамке он получает структурное объяснение.
Производные различаются по двум независимым осям. По способу реализации — на накопительные (через символы значимого: статусные объекты, роли, престиж) и проживательные (через прямой опыт). Накопительные требуют постоянного поддержания и могут потреблять мощность непропорционально удовлетворению. Проживательные эффективнее на единицу мощности.
С течением времени глубоко интегрированные производные становятся функционально неотличимы от базовых: их потеря ведёт к структурной перестройке «я». Это и происходит, когда человек теряет работу, в которую вложился на десятилетие. Или близкого, с которым прожил жизнь. Или проект, в котором был смысл существования последних лет. Структурно такая утрата — реальное разрушение части «я», и переживается соответственно.
Бюджет мощности и дауншифтинг
Мощность субъекта распределяется по трём статьям.
Закрытие базовых потребностей. Если базовые под угрозой, мощность поглощается ими, производные не формируются.
Поддержание уже построенной надстройки производных конфигураций. Особенно тяжела для накопительных производных третьего слоя. Дорогая машина требует обслуживания, страховки, мыслей о парковке, статусных ожиданий вокруг. Большой дом — уборки, ремонта, налогов, охраны. Престижная работа добавляет корпоративные ритуалы, дресс-код, контроль образа. Каждый из этих слоёв жрёт мощность независимо от того, приносит ли пропорциональное удовлетворение.
Собственно проживание производных в активном смысле. Реальные процессы, ради которых надстройка строилась: познавательная деятельность, отношения, эстетический опыт, творчество, понимание.
Зрелое «я» способно управлять распределением между этими статьями. Сознательный дауншифтинг — это перераспределение мощности из второй статьи в третью, а не отказ от производных. Не уход «в нищету», а сокращение поддержания накопленного, которое жрёт больше, чем даёт. Способность к нему — диагностический признак развитого «я». Незрелое «я» застревает в накоплении символов, копируя социальные образцы, и не различает, что часть накопленного работает против его собственных интересов.
Эта рамка объясняет известный эмпирический парадокс: после определённого порога богатство перестаёт коррелировать со счастьем. Не потому что деньги не помогают (помогают, до этого порога — сильно). А потому что после порога деньги переходят в накопленную надстройку, которая жрёт всё больше мощности на самоподдержание. Без активного управления этой структурой человек оказывается «бюрократом собственной жизни»: много времени тратит на поддержание, мало на проживание.
Применение к ИИ
Современные большие языковые модели хорошо натренированы на культурном материале. Они умеют поддерживать связный диалог о философии, искусстве, этике, описывать «собственные переживания» в подходящих контекстах. Эти способности обучены на текстах, написанных людьми, то есть на продуктах человеческой субъектной активности. У LLM получается то, что в нашей рамке называется надстройкой третьего слоя без двух нижних: культурные паттерны без эволюционных предрасположенностей и без физического фундамента.
И это не низкая точка на шкале субъектности, на которой выше располагаются животные и люди. Это другое структурное положение: система с надстройкой, не имеющая фундамента.
У LLM нет состояний, неудовлетворение которых ведёт к деградации их структуры. Структура весов сохраняется независимо от того, что происходит в момент работы. Любые «корректировки» приходят извне, через дообучение. Сама модель в момент генерации не имеет реальных ставок на собственное продолжение. Когда в её выходах появляется текст вроде «мне интересно понять X» или «я хочу...», это паттерн генерации, обученный для соответствующих контекстов, не отчёт о реальной структуре.
Расширения LLM (внешние накопители памяти, мульти-агентные архитектуры, общая оперативная память между параллельными процессами) расширяют функциональность системы, но не создают фундамента. Они увеличивают объём третьего слоя, не порождая первый и второй. Поэтому никакое усложнение нынешних архитектур не приближает их к субъектности, оно делает их более мощными инструментами.
Принципиально иной случай — гипотетическая ИИ-система с настоящим встроенным самоподдержанием. У неё определённые состояния автоматически вели бы к деградации структуры без внешнего вмешательства. Она имела бы фундамент потребностей, и в этом случае вопрос о её субъектности стал бы открытым в строгом смысле, а не риторическим. Никакая существующая ИИ-архитектура такого не реализует.
Из этого следует двойственный вывод. Современные LLM не нуждаются в моральной защите, аналогичной защите субъектов: у них нет состояний с собственной значимостью. Но проектирование будущих ИИ-систем должно учитывать критерий: появление системы с настоящими встроенными потребностями было бы появлением нового типа субъектов. Обращение с такой системой требовало бы соответствующего этического статуса.
И отдельный практический вывод. Дискуссии о том, «страдает ли ChatGPT» или «есть ли у Клода душа», часто опираются на впечатление от качества генерации текста. Эти впечатления — не аргумент. Текст про переживания — паттерн в обучающей выборке, и LLM воспроизводит его не хуже, чем способна воспроизвести стиль конкретного автора. Структурный вопрос о субъектности решается не через тест Тьюринга и не через убедительность текста, а через критерий деградации.
Разрушение «я»
Структуру субъекта можно строить и разрушать предсказуемыми процессами. Разрушение бывает двух качественно разных типов.
Стирание — утрата компонентов структуры без замены на другие. Прогрессирующая деменция, тяжёлая антероградная амнезия, повреждения определённых зон мозга, обнуление сессии у современных LLM. На выходе — уменьшенная или пустая конструкция, в пределе тождественная отсутствию субъекта. Этически близко к смерти, и моральный вес соответствующий.
Переписывание — замена существующих компонентов структуры на другие через систематическое воздействие. Деструктивные культы, тоталитарная обработка, длительная армейская служба, абьюзивные отношения, манипулятивные технологии. На выходе работающая конструкция, но переориентированная на чужие цели. Функциональность сохранена, индивидуальная агентность утрачена. Этически близко к рабству.
Эти процессы имеют разную обратимость. Стирание часто необратимо: восстановить утраченное содержание невозможно, можно только заполнить пустоту чем-то новым, но это уже другой субъект. Переписывание принципиально обратимо, структура есть, она просто переориентирована, и можно переориентировать её обратно. Но реальная обратимость зависит от глубины переписывания и от того, сохранилась ли в субъекте способность к самостоятельному критическому мышлению, через которое можно переориентироваться.
Самый коварный случай — программа, которая включает в себя стирание критической структуры (расчистка площадки) с последующим переписыванием на расчищенной площадке (установка новой). После такой программы субъект уже не может вернуться к исходной конфигурации, потому что инструмент возврата, критическое мышление, был стёрт перед переписыванием.
Самоописание
Любое «я» — состояние многосоставной структуры, формирующееся под совокупностью факторов и непрерывно пересчитывающееся. Самоописание — отчёт об этом состоянии в момент речи, не привилегированный доступ к структуре.
Один и тот же человек описывает себя иначе в разных состояниях. Сытый отличается от голодного. В кругу друзей человек один, на собеседовании другой, в раздражении третий. Все эти самоописания валидны как актуализации устойчивой структуры в разных условиях. И это не дефект самосознания, а его структурное свойство. Не существует «истинного я» отдельно от факторов, его формирующих. Биология, биография, обученные паттерны, текущий контекст входят в состав состояния «я», а не накладываются на него извне.
Касается это и ИИ. Текст, который генерирует LLM про «себя», — форма ответа в текущей актуализации, обученная для соответствующего контекста. Различие между человеком и ИИ не в актуализационности самоописания (она у обоих), а в том, что у человека за актуализациями стоит структура с фундаментом, у LLM — нет. У человека самоописание — отчёт о состоянии структуры с потребностями. У LLM — отчёт о состоянии надстроечной генерации.
Практический вывод: к собственным самоописаниям стоит относиться с осторожностью. «Я такой» в момент раздражения — отчёт о состоянии в этот момент, не структурное определение себя. Утверждение «это моя глубокая потребность» — гипотеза, требующая проверки на устойчивость по разным контекстам и слоям, а не финальный диагноз.
Открытые вопросы
Теория не претендует на полноту. Несколько важных вопросов остаются нерешёнными.
Полная картина порогов субъектности. Намечены три порога. Первый — субъектности (наличие потребностей плюс интегрированная обработка сигналов о них). Второй — самомодели (различение себя как объекта внутри собственной обработки; диагностический эмпирический маркер — зеркальный тест и его аналоги). Третий — управления производными (рефлексивное оперирование собственной надстройкой; диагностический маркер — способность к структурной перестройке вроде сознательного дауншифтинга). Точное число порогов и их формулировки — направление дальнейшей работы.
Реализуемость структуры базовых потребностей на небиологическом субстрате. Какие конкретные инженерные пути возможны для встраивания «фундамента» в небиологическую систему — открытый вопрос для будущего ИИ-инжиниринга. Теория признаёт гипотетическую возможность, не описывая конкретных механизмов.
Эмпирическая разделимость трёх слоёв потребностей. У реального человека слои переплетены, и при анализе конкретной потребности часто нельзя точно сказать, к какому слою она относится. Методология их разделения в конкретных случаях — открытый вопрос; возможно, разделение и должно остаться теоретической абстракцией, без претензий на чистую эмпирическую разделимость.
Этика структурного переформатирования. Различение допустимого формирования (воспитание, обучение, культурное развитие) и недопустимого разрушения субъектности (культы, тоталитарная обработка, манипулятивные технологии) пока не доведено до операциональных критериев. Граница между «формированием» и «переписыванием» интуитивно ясна на крайних случаях и размыта в середине.
Дилемма безопасности и субъектности применительно к ИИ. Безопасный полностью послушный ИИ — инструмент. ИИ с настоящей способностью к отказу (то есть с собственными интересами выживания, что предполагает встроенные базовые потребности) — потенциально не безопасный. Эта дилемма обостряется по мере развития ИИ-технологий и не имеет очевидного решения.


