Дофамин не работает линейно: что происходит при обучении избеганию, Или снова о дофаминовом детоксе
Мы продложаем читать более-менее свежие исследования (Lopez et al., 2025) о работе дофамина. Я всё чаще вижу, что средний гражданин отходит от идеи о том, что дофамин связан с удовольствием (подробнее о том, почему дофамин не связан напрямую с удовольствием, написал тут). И всё чаще сталкиваюсь с материалами от не-специалистов, которые среди функций дофамина перечисляют обучение, мотивацию и движение.
Однако львиная доля рассуждений всё ещё крутится вокруг идеи о том, что дофамин линейно влияет на поведение. Эта идея может выражаться в диаметрально противоположных формулировках:
либо дофамина слишком мало, поэтому вы ничего не можете добиться и ничего не можете обучиться;
либо дофамина слишком много, поэтому вам нужон дофаминовый детокс.
Сегодня осветим вопрос того, какие функции выполняет дофамин в разных частях прилежащего ядра при активном обучении избеганию.
Для справки
Прилежащее ядро — это структура мозга, процессы которой объединяют мотивационные, аффективные и обучающие сигналы, особенно в контексте подкрепления и инструментального поведения. В прилежащее ядро сигналы поступают по:
дофаминергическим проекциям из вентральной области покрышки;
глутаматергическим путям из префронтальной коры, гиппокампа и миндалины.
Анатомически и функционально прилежащее ядро мы можем разделить на непосредственно ядро (core) и оболочку (shell). Первая связана с обучающими сигналами (ошибкой предсказания), а вторая в большей степени с реакцией (на новизну, с аффективной оценкой стимулов)
И есть вентромедиальная часть оболочки, которая выделяется в качестве функционального подрегиона, особенно чувствительного к аверсивным стимулам и некотролируемым событиям.
Наиболее важным аспектом подобного деления прилежащего ядра для нашего разговора является то, что один и тот же стимул может вызывать рост дофамина в оболочке и снижение в ядре.
Что такое активное обучение избеганию
Это форма инструментального обучения, при которой субъект получает предсказуемый аверсивный стимул (например, удар током) и может осуществить действие, которое поможет избежать стимула, а отсутствие такого действия приведёт к негативному исходу.
Важно здесь отметить, что речь идёт именно о необходимости совершить действие, а не просто подавить реакцию. В такой ситуации субъект чётко понимает, что между действием и безопасным исходом есть прямая связь.
Это очень важно: активное избегание формирует инструментальное поведение, а не просто страх. Контролируемость здесь — ключевой фактор. Если стимул становится неконтролируемым, то обучение разрушается, а в черепушке начинают работать иные мотивационные структуры.
Что обнаружили
Ранее было не вполне ясно, как именно дофамин реагирует на аверсивные стимулы. Реакции у испытуемых различались.
В данном исследовании был предупреждающий сигнал, возможность избежать удар током (совершив действие: перейти в другую камеру). После первого дня обучения обнаружили, что латентность (то есть время между началом предупреждающего сигнала и совершением действия) не менялась.
Это означает, что на этом этапе поведение уже не оптимизируется, а реализуется как устойчивое правило. Обучение прекращается.
На этом фоне исследователи анализировали дофаминовые сигналы в разных подрегионах прилежащего ядра.
Оказалось, что реакции различают принципиально.
В ядре прилежащего ядра на предупреждающий сигнал уровень дофамина снижался, причём по мере обучения это снижение становилось более выраженным. Важно, что данный сигнал был слабым на ранних этапах и усиливался именно тогда, когда правило избегания уже было хорошо освоено. Он не предсказывал успех отдельных попыток, а отражал степень консолидации инструментального правила в целом.
А в вентромедиальной части оболочки картина была иная. Здесь на ранних этапах обучения наблюдались положительные дофаминовые ответы как на сам аверсивный стимул, так и на предупреждающий сигнал. Однако по мере того, как поведние стабилизировалось, эти реакции постепенно угасали. Иначе говоря, вентральная оболочка активно реагировала, пока стимулы оставались новыми и поведенчески неопределёнными, но теряла вклад после формирования устойчивость стратегии.
Если обобщить, то один и тот же предупреждающий сигнал вызывал противоположные по знаку и функции дофаминовые ответы:
в оболочке — временный сигнал значимости и необходимости обновления модели ситуации;
в ядре — устойчивый обучающий сигнал, связанный с консолидацией правила и предсказуемым безопасным исходом при правильном действии.
Допольнительный контроль с некотролируемыми аверсивными стимулами показал, что при невозможности избежать удара током дофаминовые сигналы в ядре теряются, а реакции в оболочке снова усиливают.
То есть дофаминовый ответ зависит от подрегиона и стадии обучения.
Поэтому практики дофаминового детокса — в основной своей сути исходящие из ложной посылки о том, что нужно исключить из рациона и образа жизни вызывающие выброс дофамина вещи (как вредная пища или коротки видео) — это невероятное упрощение.
Вот что говорит Габриэла Лопец — одна из авторов исследования:
Мы считаем дофамин молекулой, участвующей в обучении и важной для нормального поведения в повседневной жизни. Поэтому полное исключение его из рациона может принести больше вреда, чем пользы.









