Серия «Дофамин и все-все-все»

8

Ацетилхолин и дофамин. Как примирить срез мозга и живого человека

Серия Дофамин и все-все-все

Десятый, юбилейный пост для серии "Дофамин и все-все-все". Мы довольно много говорили о том, как дофамин работает сам по себе, безотносительно иных нейромедиаторов и веществ в мозге. И тому была причина: дофамин и его влияние — суть сложные явления. Для поиска истины и опровержения устаревших представлений требуются нетривиальные исследования и эксперименты.

Что уж говорить о связи дофамина с иными нейромедиаторами, но такие исследования конечно же проводились. Как только вы множите сущности и параметры, за которыми нужно следить и которые нужно объяснить, так сразу же сложность исследования возрастает в гомерической прогрессии.

Отчасти поэтому на протяжении десятилетий нейробиологи изучали срезы мозга, помещенные в питательную среду, где ткани сохраняют жизнеспособность, но изолированы от целого организма. В этих условиях (in vitro) взаимодействие между ацетилхолином и дофамином выглядело абсолютно очевидным и не вызывало сомнений.

Исследователи фиксировали, что стимуляция даже единичной холинергической клетки (выделяющей ацетилхолин) приводит к мощному и быстрому выбросу дофамина из нервных окончаний. Этот механизм в исследованиях был показан напрямую, был показан надёжно и воспроизводился.

Ацетилхолин связывается с никотиновыми рецепторами на дофаминовых волокнах и заставляет их выделять дофамин.

Однако, когда ученые переходили к экспериментам на живых, свободно ведущих себя животных (in vivo), механизм исчезал.

При измерении тех же самых процессов в мозге живого существа, выполняющего простые задачи или находящегося в состоянии покоя, прямой эффект ацетилхолина на выброс дофамина практически не фиксируется. Ацетилхолин выделяется, дофамин выделяется, но той надёжной и прямой причинно-следственной связи, которая совершенно точно была в исследованиях на срезах, не было.

"Да тут всё понятно", — скажет комментатор, — "дело в том, что исследования in vitro создают неестественные условия! Возможно, в изолированном срезе ткани нейроны ведут себя аномально, и этот мощный эффект ацетилхолина — всего лишь артефакт лабораторных условий, не имеющий отношения к реальной работе живого мозга"

Или

"Эксперименты in vivo недостаточно точны, чтобы уловить тонкие локальные взаимодействия, которые происходят в глубинных структурах живого мозга."

Большинство учёных, кстати, склонялись к первому варианту: авторитетные публикации утверждали, что холинергические интернейроны в живом мозге не управляют напрямую выбросом дофамина, а выполняют совершенно иные функции.


И вот у нас есть исследование Стэнфордского университета 2026 года, которое показывает, что механизмы взаимодействия между ацетилхолином и дофамином не являются статичными и не работают в постоянном фоновом режиме. Это взаимодействие строго контекстно-зависимо.

Предыдущие исследования in vivo наблюдали за животными в состоянии низких поведенческих затрат (например, в покое, при получении лёгкой награды или при простых движениях). В этих состояниях локальный механизм регуляции дофамина ацетилхолином действительно спит и не проявляет себя. Однако, как только организм сталкивается с необходимостью прилагать значительные усилия, этот механизм активируется.

Наконец, стало чуть понятнее то, как именно мозг реализует феномен оправдания усилий. Усиление дофаминового ответа на награду, для получения которой пришлось потрудиться, не является пассивным следствием общей активности мозга.

Это активный, локально регулируемый процесс.

Ацетилхолин, выделяемый интернейронами прилежащего ядра, действует на никотиновые рецепторы, расположенные непосредственно на аксонах дофаминовый нейронов. И этот механизм активируется только в контексте высоких поведенческих затрат: при низкой активности или в состоянии покоя данный механизм не наблюдается.

А блокирование этого локального взаимодействия (фармакологически или генетически) избирательно нарушает готовность животного прилагать усилия для получения награды, при этом потребление легкодоступной награды остаётся неизменным. То есть механизм разделения wanting и liking сохраняется.

О механизме разделения wanting и liking уже писал для Пикабу:

  1. Теория стимульной сенсибилизации, или Почему зависимость работает не так, как принято думать

  2. Удовольствие, желание и дофамин


Телега для вопросов и непрошенных ответов. Принимаю поддержку плюсиками, восторженными комментариями и рублями.

Показать полностью
0

Дофамин и педаль масла, или как RiseToday исследование Liu et al. 2025 читали

Серия Дофамин и все-все-все

Пост навеян публикацией RiseToday, где граждане вновь прилепили ссылку на исследование наобум. Но граждане прогрессируют. От полнейшего бреда до осмысленного заблуждения они прошли достаточно быстро.

Если вам пихуй на детали и лень читать, то вот публикация с нейроновостей, где коротко и доходчиво описаны выводы.


Все мы, абсолютно каждый без исключения, знаем, что гибель дофаминовых нейронов чёрной субстанции ведёт к брадикинезии, а леводопа возвращает пациентам возможность двигаться. Отсюда растут ноги у предположения о том, что дофаминовые сигналы действуют как регулятор энергичности действий (vigor) в том числе и при болезни Паркинсона. Чем сильнее всплеск дофамина в стриатуме прямо перед движением, тем быстрее и мощнее будет само движение.

Однако в новом (по меркам науки) исследовании, опубликованном в Nature Neuroscience, гражданин Liu с соавторами поставили на вышеописанной гипотезе жирный крест. Они провели серию элегантных экспериментов с мышами, которые обучались произвольно (self-paced) нажимать левой лапой на рычаг с нагрузкой. Нажатие баллистическое, требует усилия, подкрепляется водой. Всё как мыши (и мы) любят.

Во-первых, авторы подтвердили необходимость дофамина. Гемилезия 6-OHDA — классический метод уничтожить дофамины у грызунов — и мыши перестают совершать энергичные нажатия. Левадопа это состояние временно снимает.

Во-вторых, задались вопросом, как субсекундные флуктуации DA связаны с параметрами движения? Поставили дофаминовые сенсоры в дорсолатеральный и дорсомедиальный стриатумы и провели замеры. Оказалось, что в DLS уровень дофамина в момент нажатия не растёт, а немного падает без предшествующих всплесков. Обнаружили слабую отрицательную корреляцию между дофамином и пиковой скорость / амплитудой (практически ноль, иногда значимая, но на удивление отрицательная).

Однако в DMS ситуация была другая: дофамин медленно поднимался за секунду до нажатия, но опять же — корреляция с энергичностью отсутствовала на уровне отдельных попыток.

В-третьих, при использовании оптогенетики было обнаружено, что ингибиция mDANs на 2 секунды в начальной части попыток не влияет на скорость или амплитуду нажатия. Равно как и активация на 1 секунду на разных интенсивностях — от физиологических до супрафизиологических — тоже не меняет силу движения.

В четвёртых, наконец, ключевое наблюдение показало, что у мышей с полной лезией дофаминовых нейронов введение леводопы восстанавливает способность к нажатиям, но в стриатуме полностью отсутствуют субсекундные тразиенты (в народе называемые всплесками).

Есть только медленное, тоническое повышение фонового сигнала. И raclopride, который убирает тонический компонент, ухудшает эффект. Поэтому выходит, что для поддержания vigor достаточно просто поднять базовый уровень дофамина, а фазические всплески не нужны.

Натягиваем сову на глобус

Авторы предложили пересмотреть модель, где субсекундный дофамин управляет энергичность. Вместо этого они предложили вернуться к истокам и рассматривать дофамин в данном контексте как классический сигнал обучения с подкреплением.

Именно через пластичность стриарных синапсов, которая требует временной близости сигнала и действия, дофамин формирует способность выполнять движения с определённой энергией. Но в момент уже выученного баллистического движения дофамин просто "разрешает" (в ориг. permissive role) или задаёт контекст (тонус), но не диктует (dick) параметры.

Что как бе согласуется с рядом последних работ (Cai et al., 2024; Delignat-Lavaud et al., 2023), показывающих, что фазическая активность дофамина не обязательна для простых движений, а нужна для подкрепления и адаптации.

Оговорки, которые никому не нужны

Фотометрия усредняет сигнал, поэтому можно пропустить очень локальные и специфичные всплески. К тому же, в исследовании изучали высоко автоматиизированное, стереотипное движение. Возможно, что для текущей коррекции траектории в более сложной среде роль дофамина была бы иной. Но тут — нет.


Возвращаемся к гражданам из RiseToday. Они ссылаются на исследование в следующе контексте:

Дофаминовые всплески и их бесполезность

Обратимся к недавнему исследованию, которое и стало двигателем для написания статьи. Речь в нем идет о том, что дофамин больше похож на машинное масло, нежели на бензин. Он не служит искрой или топливом для поддержки мотивации. Вместо этого дофамин продолжает двигаться, снова, и снова, и снова. Просто поддерживать движение.

В этом разрезе, всплески дофамина совершенно бессмысленны и бесполезны. Они не дадут какого-то ощутимого продвижения в деле, которым вы занимаетесь. Но вместо этого: снизят чувствительность рецепторов и подарят ощущение «наличия безграничных возможностей».

Любая аналогия — это котёнок с дверцей. Но если они вам так нравятся, то дофамин в данном контексте — это инструктор по вождению, который не крутит руль за вас, но отмечает удачные движения, чтобы в будущем вы научились нажимать на педаль с правильной силой.

Ни бензин, ни машинное масло здесь не подходят.

Попытка показать, что дофамин — не бензин, привела граждан к прямо противоположному выводу исследования. Ведь там отчётливо было показано, что без дофамина движения вообще нет. То есть дофамин абсолютно необходим.

И я не устану повторять: пока вы не выбьете у себя из головы, что дофамин и его работа как-то субъективно ощущаются, вы будете лгать и обманываться, каждый раз притягивать дофамин туда, где ему не место, придумывать какие-то странные практики и выводы о работе дофамина.

Ну вы же должны читать работы, на которые ссылаетесь. Вы должны понимать, что тема просто пиздецки сложная и простых выводов там нет. А это люди проводили конкретные и крайне локальные исследования. И всё равно ничего толком не могут сказать. С чего вы решили, что сможете сейчас что-то соотносящееся с реальностью придумать?

Да хуй с этими выводами. Вы почему думаете, что можно выводы исследований на мышах с Паркинсоном переносить на здоровых людей?

Показать полностью
8

Ответ на пост «Шило на мыло. Почему мозг не бросает привычки»1

Серия Дофамин и все-все-все

Ура! Снова кто-то пишет про дофамин на Пикабу отсебятину. Давно такого не было, но снова... К сожалению, пост помечен тегом "Контент нейросетей".

Нейросеть повествует о привычках и о том, какую роль здесь играет нейробиология. Нейросеть сразу предупреждает, что дело не в лени:

Думал это слабохарактерность. Потом копнул. Нет. Это нейробиология.

Это типичный маркер нейросети. Она улавливает тончайшие виляния жопой человека и воспроизводит их. Я давно хотел написать о том, что вот это распространённое противопоставление "это не лень, это нейробиология" — тупость.

Дело в том, что нейробиология лишь частично пересекается с поведением животного. Да, существуют состояния, которые внешне выглядят как леность, но нейробиологически поддерживаются не так, как обычно организована лень. С другой стороны, есть класс нейробиологических явлений, который пересекаются с тем, что мы называем ленью: и в быту, и в науке.

Когда речь заходит о "это не лень, это нейробилогия", обычно происходит подмена описания одного уровня другим. С тем же успехом можно сказать "это не подпись в документе, это система движений мышц руки... которая коррелирует с подписью".

Дофамин. Все о нём слышали. Мало кто понимает информацию правильно.

Да. Часто называют его гормоном, когда говорят о его нейромедиаторных функциях. Часто балуются рокировкой дофамин и допамина.

Дофамин не гормон удовольствия. Это гормон предвкушения.

Об чём и речь. Но я уже толерантен к тому, что дофамин называют гормоном.

Когда ты делаешь что-то приятное, мозг записывает: сигнал, действие, награда. Повтори.

Классическая ошибка в разговорах о дофамине. Эта ошибка просто убивает любую вашу даже вменяемую попытку разобраться в том, что же такое дофамин и что он делает.

Вы всякий раз будете искать элемент "приятного", вы постоянно будете скатываться к связке "приятно = дофамин". И это постоянно будет вести вас к ложным суждениям.

Сей текст настолько напохуй нагенерирован (да и я уверен, что автор сам считает), что дальше он эту проблему подсветит.

Ещё раз: дофамин не связан с удовольствием

Вбейте себе это в голову, если хотите понимать дофамин и его работу. Да, некоторые действия и события, которые мы сочли приятными, вызывают выброс дофамин. Однако дофамин вырабатывается не приятные стимулы и не вызывает приятных чувств. Дофамин может вырабатываться на аверсивные стимулы: на удар током.

Schultz описал этот механизм в 1997 году. Назвал reward prediction error. Мозг не реагирует на саму награду. Он реагирует на разницу между ожиданием и реальностью. Получил больше чем ждал - дофаминовый всплеск. Получил ровно столько - тишина. Получил меньше - провал. Ломка. Тревога. Злость.

Мозг реагирует на саму награду. И на разницу между ожиданием и реальностью он реагирует. Не совсем так, как многие представляют, но реагирует.

"Получил меньше - провал. Ломка. Тревога. Злость." — бред.

Механизм одинаков для никотина, еды, бухла, mj. Мозгу всё равно что именно. Ему важен дофаминовый скачок.

О чём я и говорил. Связка "дофамин — удовольствие" будет постоянно сбивать вас. Вы постоянно будете генерировать вот такие суждения, которые с реальностью имеют мало общего.

Никотин связан с никотиновыми ацетилхолиновыми рецепторами, алкоголь — с ГАМК и глутаматом, каннабис — с каннабиноидными рецепторами. Да, они связаны с дофамином. Потому что он в сети выступает в качестве модулятора, но мозгу не всё равно.

Вот тут начинается самое интересное.

Хроническое употребление никотина давит D2-рецепторы. Это рецепторы в стриатуме которые отвечают за торможение импульсивного поведения. Проще: D2 это внутренний тормоз. Никотин его стачивает. Годами. Исследование из Oxford Academic, 2016: у курильщиков доступность D2/D3-рецепторов в вентральном стриатуме снижена, и это коррелирует со степенью никотиновой зависимости. Та же картина что при зависимости от других веществ.

Нейросеть не справилась. Если вы хотя бы раз от разбирающегося специалиста слышали, что у зависимых снижена доступность D2/D3 рецепторов, то неминуемо слышали, что причинность не установлена.

У нас есть корреляционные исследования, большая часть которых использует PET, то есть измеряет потенциал связывания, а не количество рецепторов. И эти исследования действительно демонстрируют, что у зависимых (курильщиков в т.ч.) снижена D2/D3-доступность.

Из этого не следует, что именно никотин в этом виновен. Большая часть таких исследований — кросс-секционная, то есть сравнивает людей между собой, а не сравнивает динамику внутри одного человека. Вполне возможно, что именно низкая доступность дофаминовых рецепторов толкает людей на зависимости, а не наоборот.

Что тоже нужно доказывать.

А когда мы проводим лонгитюдные исследования, то сталкиваемся с тем, что да:

  1. у зависимых наблюдается снижение доступности,

  2. и при длительной абстиненции возможна частичная нормализация.

Но изменения эти неоднородны: ни снижение доступности, ни нормализация не происходят ни линейно, ни универсально. Если бы никотин прямо разрушал рецепторы, то ожидалась бы чёткая динамика или чёткая обратимость.

Их нет.

Где ссылки на исследования, подтверждающие мои слова? Так они в посте у ТСа есть.

И последнее:

Мозг привыкает к высокому уровню стимуляции. Обычное состояние воспринимает как дефицит. Убрал никотин - дефицит никуда не делся. Мозг ищет чем закрыть дыру.

Вот что меня зацепило больше всего. Berridge из Мичиганского университета разделил дофаминовую систему на "wanting" и "liking". Хотеть и нравиться. Это не одно и то же.

Liking - это удовольствие. Оно работает через опиоидные рецепторы. Маленькие зоны в мозге. Тонкая настройка.

Wanting - это мотивация, тяга, побуждение. Работает через дофамин. Массивная система. Грубая сила.

При хронической зависимости wanting растёт, а liking падает. Ты хочешь сигарету всё сильнее. А удовольствия от неё всё меньше. Знакомо? Мне знакомо. Первая затяжка утром: збс. Десятая за день: механически, на автомате, прям положняк, даже не замечаешь.

Когда бросаешь, wanting не исчезает. Оно переключается. На еду, бухло, mj, телефон, порнуху. Что угодно. Система не выключается. Она находит новый объект.

Уже писал об этом.

Теория стимульной сенсибилизации, или Почему зависимость работает не так, как принято думать


У нас есть материал на темы теории сенсибилизации стимулов, исследований Шульца, а ещё пишем о теории самодетерминации.

Телега для подписки и вопросов.

Показать полностью
4

Дофамин, проблемы RPE и мыши в виртуальной реальности

Серия Дофамин и все-все-все

А пока мы ждём свежую статью о дофамине, которая вышла в январе и ещё недоступна простым смертными, живущим за стенами академических подписок, предлагаю поговорить о работе, которая вышла в 2024-м году. Называется "Explaining dopamine through prediction errors and beyond".

Дело в том, что классическая теория ошибки предсказания вознаграждения (русскоязычный обзор Шульца 1997 и аналогичный обзор Шульца 1998), при всей её элегантности, напоминает слишком тесный пиджак: она не может охватить всё эмпирическое богатство поведения дофаминовых нейронов.

Марк Хамфрис, нейробиолог из Ноттингема, выразился по этому поводу довольно ёмко:

Дофамин был единственной областью нейронауки, где у нас была вычислительная модель, объясняющая, что это за сигнал и что он вычисляет.

Но теперь той модели, первоначальной, уже недостаточно.


Авторы рассматривают три ключевых эмпирических наблюдения, которые ставят под сомнение стандартную RPE-модель. Они обращаются к наиболее важным работам, на которых основываются представления современной нейронауки о дофамине.

Рампинг

В 2013 году вышла работа (Howe et al., 2013), которая показала, что дофамин в стриатуме крысы, бегущей по Т-образному лабиринту к вкусняшке, плавно нарастает по мере приближения цели, а не просто щёлкает в момент вознаграждения или предсказания награды. Это явление — плавного нарастания — назвали рампингом.

Классическая RPE-модель этого не предсказывала. Поэтому некоторые травмаищи, ехидно потирая ручки, предположили, что дофамин кодирует не ошибку, а чистую ценность (value) или состояние. Чем ближе цел, тем выше ценность, тем больше дофамина.

Дальнейшее исследование и дальнейший эксперимент (Kim et al., 2020) был взрывом мозга, ибо мышь поместили в виртуальную реальность. Там сферический беговой трек (по сути, шар, который крутится лапками, как хомячок в колесе, но в 3D), мышь бежит по виртуальной дорожке. Исследователи делают фокус: телепортируют животное в одну и ту же точку, но с разной дистанции.

Если дофамин кодирует просто ценность, то в одной и той же точке сигнал должен быть одинаковым, независимо от того, откуда мышь пришла.

Если дофамин это ошибка предсказания, то чем длиннее был прыжок (че неожиданнее изменение ценности), тем сильнее должен быть всплеск.

Сработал второй вариант. Дофамин бил сильнее именно после длинной телепортации. RPE-гипотеза выстояла.

Но оставался вопрос: почему рампинг есть в навигации, но его практически нет в классических павловских экспериментах (где просто зажигают лампочку и дают еду)?

Ответ, как водится, в деталях. В навигации у животного есть постоянная сенсорная обратная связь (я бегу, столбики мелькают). В павловском опыте между стимулом и наградой — тишина и темнота, и внутренние часы у мозга работают с шумом. Чем дольше тишина, тем выше неопределённость.

Гершман и Микаэль (Mikhael et al., 2022) построили модель, которая показывает, что из-за этой неопределенности возникает систематическое смещение в оценке ценности. И чтобы это смещение скорректировать, мозгу приходится генерировать ненулевые RPE, которые и выглядят как рампинг. Более того, они предсказали, что если во время движения постепенно затемнять картинку (менять сенсорную обратную связь), то рампинг превратится в "бугорок" — что и подтвердилось на практике.

Дофамин глядит по сторонам

Мы привыкли, что дофамин отвечает на награду, но авторы статьи напоминаю, что дофаминовые нейроны стреляют и на новые, неожиданные стимулы, даже если те сами по себе ничего не значат. Это может быть щелчок, вспышка, новый звук.

Классическая теория объясняла это "бонусом за новизну" (Kakade & Dayan, 2002) — мол, мозг оптимистично инициализирует ценности новых объектов, чтобы мы их исследовали. Но новые данные требуют большего.

Например, феномен identity unblocking (Chang et al., 2017). Если крысу научить, что стимул А ведёт к награде, а потом добавить к нему стимул Б, но награду не менять, то Б не вызовет интереса (блокировка). Механизм, известный благодаря Леону Камину и товарищам Рескорле и Вагнеру.

Но если вместо старой награды дать новую, с той же ценностью (например, вместо одной вкусняшки — другую, но такую же вкусную), блокировка снимается. Крыса понимает, что что-то поменялось. И дофамин в этом процессе участвует напрямую — его подавление во время фазы "составного стимула" убивает эффект.

Авторы предлагают концепцию "обобщённой ошибки предсказания". Дофамин сигнализирует не только о том, сколько сахара дали, но и о том, что именно произошло. Это подводит нас к важнейшему выводу: сигнал дофамина — векторный, а не скалярный.

Но если он векторный, как он закодирован в мозге? Варианта предположили два: принцип меченых линий и распределённый код.

Первый предполагает, что разные группы нейронов, дающие проекции в разные зоны, несут разные сообщения. Одни несут ценность, другие — угрозу, третьи — новизну (Menegas et al., 2017; Akiti et al., 2022).

Второй предполагает, что информация перемешана на уровне популяции, и её нужно "демультиплексировать" на местах.

Исследование Stalnaker et al., 2019 показывает, что работает, скорее всего, второй вариант. Информацию о том, какая именно награда выпала (identity), нельзя прочитать из активности одного нейрона — её видно только на уровне ансамбля. Причём видно лишь в начале обучения, пока ошибка предсказания велика.

Пресловутая педаль газа

Меня корёжит от аналогий с педалями газа и тормоза, от аналогий с курьерами и радио, от аналогий с оркестром и дирижёром. Но здесь аналогия буквальная.

Дофамин явно влияет на движение: на иницииацию, скорость и кинематику. Но вписывается ли это в RPE-модель?

Например, активность в проекциях дофамина на дорсальный стриатум не всегда чётко различает типы движений (Markowitz et al., 2023). Это проблема, если мы хотим использовать дофамин для точного выбора действия.

Авторы предлагают изящное решение, ссылаясь на модель Линдси и Литвин-Кумара (Lindsey & Litwin-Kumar, 2022). Идея в том, что дофамин может нести сигнал "сюрприза действия" (action surprise). Если животное сделало что-то маловероятное (с точки зрения его текущей политики, читайте про обучение с подкреплением), дофамин отмечает это событие. Такой сигнал неспецифичен (он не различает, какое именно редкое действие сделано), что объясняет результаты Марковица. И он убывает по мере научения, когда действия становятся автоматическими. А главное — такая модель решает проблему кредита assignmen: как понять, кто виноват, если базальные ганглии предлагали одно, а моторная кора сделала другое?

Экспериментальные данные Гринстрита (Greenstreet et al., 2022 — препринт, но авторы на него ссылаются, а исследование вышло в мае 2025, о чём я писал, но лучше бы не писал; Greenstreet et al., 2025) подтверждают, что в проекциях на хвост стриатума есть нейроны, которые реагируют именно на сюрприз действия, а не на ценность награды.

Так что же такое дофамин?

Дофамин, проблемы RPE и мыши в виртуальной реальности

С одной стороны, авторы показывают, что RPE-гипотеза жива и, если её как следует докрутить (учесть неопределённость, обобщить на сенсорику, добавить сигналы действий), она объясняет очень многое.

С другой стороны, они честно признают: есть вещи, которые RPE-модель в лоб не берёт. Например, теория perceived saliency (Kutlu et al., 2021, 2022). Согласно ей, дофамин в прилежащем ядре реагирует на значимость стимула (произведение физической яркости и "внимательной ценности"), что объясняет, почему на ожидаемую боль нейроны тоже стреляют, а на пропуск боли — стреляют ещё сильнее (потому что отсутствие боли — это новое и неожиданное событие).

Есть и гипотеза ретроспективных выводов (Jeong et al., 2022): дофамин помогает вычислять, что именно стало причиной награды. А есть модель адаптивной скорости обучения (Coddington et al., 2023), где дофамин подкручивает темп обучения в зависимости от того, насколько успешна текущая политика.

Спасибо за внимание!

Показать полностью 1
7

Дофамин не работает линейно: что происходит при обучении избеганию, Или снова о дофаминовом детоксе

Серия Дофамин и все-все-все

Мы продложаем читать более-менее свежие исследования (Lopez et al., 2025) о работе дофамина. Я всё чаще вижу, что средний гражданин отходит от идеи о том, что дофамин связан с удовольствием (подробнее о том, почему дофамин не связан напрямую с удовольствием, написал тут). И всё чаще сталкиваюсь с материалами от не-специалистов, которые среди функций дофамина перечисляют обучение, мотивацию и движение.

Однако львиная доля рассуждений всё ещё крутится вокруг идеи о том, что дофамин линейно влияет на поведение. Эта идея может выражаться в диаметрально противоположных формулировках:

  • либо дофамина слишком мало, поэтому вы ничего не можете добиться и ничего не можете обучиться;

  • либо дофамина слишком много, поэтому вам нужон дофаминовый детокс.

Об оптимуме дофамина на Пикабу написано здесь. Также есть пересказ самого исследования.


Сегодня осветим вопрос того, какие функции выполняет дофамин в разных частях прилежащего ядра при активном обучении избеганию.

Для справки

Прилежащее ядро — это структура мозга, процессы которой объединяют мотивационные, аффективные и обучающие сигналы, особенно в контексте подкрепления и инструментального поведения. В прилежащее ядро сигналы поступают по:

  1. дофаминергическим проекциям из вентральной области покрышки;

  2. глутаматергическим путям из префронтальной коры, гиппокампа и миндалины.

Анатомически и функционально прилежащее ядро мы можем разделить на непосредственно ядро (core) и оболочку (shell). Первая связана с обучающими сигналами (ошибкой предсказания), а вторая в большей степени с реакцией (на новизну, с аффективной оценкой стимулов)

И есть вентромедиальная часть оболочки, которая выделяется в качестве функционального подрегиона, особенно чувствительного к аверсивным стимулам и некотролируемым событиям.

Наиболее важным аспектом подобного деления прилежащего ядра для нашего разговора является то, что один и тот же стимул может вызывать рост дофамина в оболочке и снижение в ядре.

Что такое активное обучение избеганию

Это форма инструментального обучения, при которой субъект получает предсказуемый аверсивный стимул (например, удар током) и может осуществить действие, которое поможет избежать стимула, а отсутствие такого действия приведёт к негативному исходу.

Важно здесь отметить, что речь идёт именно о необходимости совершить действие, а не просто подавить реакцию. В такой ситуации субъект чётко понимает, что между действием и безопасным исходом есть прямая связь.

Это очень важно: активное избегание формирует инструментальное поведение, а не просто страх. Контролируемость здесь — ключевой фактор. Если стимул становится неконтролируемым, то обучение разрушается, а в черепушке начинают работать иные мотивационные структуры.

Что обнаружили

Ранее было не вполне ясно, как именно дофамин реагирует на аверсивные стимулы. Реакции у испытуемых различались.

В данном исследовании был предупреждающий сигнал, возможность избежать удар током (совершив действие: перейти в другую камеру). После первого дня обучения обнаружили, что латентность (то есть время между началом предупреждающего сигнала и совершением действия) не менялась.

Это означает, что на этом этапе поведение уже не оптимизируется, а реализуется как устойчивое правило. Обучение прекращается.

На этом фоне исследователи анализировали дофаминовые сигналы в разных подрегионах прилежащего ядра.

Оказалось, что реакции различают принципиально.

В ядре прилежащего ядра на предупреждающий сигнал уровень дофамина снижался, причём по мере обучения это снижение становилось более выраженным. Важно, что данный сигнал был слабым на ранних этапах и усиливался именно тогда, когда правило избегания уже было хорошо освоено. Он не предсказывал успех отдельных попыток, а отражал степень консолидации инструментального правила в целом.

А в вентромедиальной части оболочки картина была иная. Здесь на ранних этапах обучения наблюдались положительные дофаминовые ответы как на сам аверсивный стимул, так и на предупреждающий сигнал. Однако по мере того, как поведние стабилизировалось, эти реакции постепенно угасали. Иначе говоря, вентральная оболочка активно реагировала, пока стимулы оставались новыми и поведенчески неопределёнными, но теряла вклад после формирования устойчивость стратегии.

Если обобщить, то один и тот же предупреждающий сигнал вызывал противоположные по знаку и функции дофаминовые ответы:

в оболочке — временный сигнал значимости и необходимости обновления модели ситуации;

в ядре — устойчивый обучающий сигнал, связанный с консолидацией правила и предсказуемым безопасным исходом при правильном действии.

Допольнительный контроль с некотролируемыми аверсивными стимулами показал, что при невозможности избежать удара током дофаминовые сигналы в ядре теряются, а реакции в оболочке снова усиливают.

То есть дофаминовый ответ зависит от подрегиона и стадии обучения.


Поэтому практики дофаминового детокса — в основной своей сути исходящие из ложной посылки о том, что нужно исключить из рациона и образа жизни вызывающие выброс дофамина вещи (как вредная пища или коротки видео) — это невероятное упрощение.

Вот что говорит Габриэла Лопец — одна из авторов исследования:

Мы считаем дофамин молекулой, участвующей в обучении и важной для нормального поведения в повседневной жизни. Поэтому полное исключение его из рациона может принести больше вреда, чем пользы.

Показать полностью
7

Ни много ни мало: оптимум дофамина

Серия Дофамин и все-все-все

Для когнитивных функций важен оптимальный уровень дофамина

Дофамин играет ключевую роль в том, как мы удерживаем информацию в голове и управляем собственным поведением. Именно он помогает держать в памяти актуальные данные и вовремя обновлять их, когда ситуация меняется.

Проблема в том, что его действие далеко не прямолинейное. В популярной науке, психологии и разговорах на кухне соседствуют противоречивые суждения о дофаминовых ямах, дефиците дофамина и о том, откуда получать дофамин, да не абы какой, а сложный, не дёшевый.

Логично было бы ожидать: чем больше дофамина, тем лучше работает память и внимание, но исследования показывают, что дофамин подчиняется инвертированной U-зависимости. В середине кривой — оптимум, при котором мозг справляется лучше всего. Если уровень ниже, память становится нестабильной, внимание рассеивается. Если выше — наоборот, система застревает, теряя гибкость.

На разных участках мозга дофамин выполняет разные задачи. В префронтальной коре он помогает поддерживать устойчивые представления, фильтруя шум и усиливая сигнал. Это как умение сосредоточиться на нужном и не отвлекаться. А в стриатуме дофамин обеспечивает противоположное — возможность переключиться, обновить информацию, адаптироваться к новым условиям. В норме эти процессы уравновешены: один держит нас в рамках, другой позволяет выйти из них, когда это необходимо.

Эта двойственность отлично видна на экспериментах с обезьянами [Vijayraghavan, 2007]. Когда исследователи прямо подавали агонисты D1-рецепторов в префронтальную кору, слабая стимуляция делала работу нейронов более избирательной: они лучше различали важное и игнорировали лишнее. Но сильная стимуляция напротив глушила их полностью, и клетки переставали кодировать нужную информацию. Другими словами, слишком много дофамина разрушало тот же механизм, который при малых дозах помогал ему работать.

И ещё один важный момент: у разных людей исходная точка на этой кривой разная [R. Cools, M. D’Esposito, 2011]. Есть генетические факторы, например полиморфизм COMT, из-за которых у одних в префронтальной коре дофамина меньше, у других больше. Поэтому лекарства, повышающие дофамин, одним действительно помогают сосредоточиться и улучшить память, а другим — наоборот, мешают. То же подтверждают и исследования с ПЭТ-сканированием: уровень дофаминового синтеза в стриатуме связан с работой памяти, но эта связь нелинейная и зависит от конкретной задачи.

На практике всё это значит, что универсальной дофаминовой таблетки быть не может. При болезни Паркинсона дефицит дофамина в стриатуме действительно можно компенсировать препаратами, и человек возвращает утраченную гибкость. Но при СДВГ или шизофрении картина другая: там вмешательство в дофаминовую систему может дать совершенно противоположный результат.

В целом всё, но чуть подробнее здесь.

Ну и напоминаю для проформы, что дофамин контекст-зависим.

Показать полностью
9

Новостные статьи разжижают мозг сильнее алкоголя

Серия Дофамин и все-все-все

На Пикабу мне выпали аж два поста (тык и тык) про ужасный ТикТок, который опаснее алкоголя. Первый гражданин ссылается на новость с TOI, а второй (в комментариях) на статью с Forbes; обе ведут на исследование из Китая.

Оба гражданина оставили ссылки на тг, но фаллических оценок в панамку насыпали только второму. Как же в мире много несправедливости. Энивей.

Сперва новость из TOI:

просмотр коротких видеороликов не просто развлекает вас, но и может физически изменить ваш мозг

Нет, исследование показало корреляцию. Причинность может быть иная, например, предрасположенные люди (с уже подсроенным под зависимости мозгом) могли попасть в исследование и подсесть на ТикТок. В исследовании не было продемонстрировано, что мозг меняется.

Исследователи обнаружили, что у заядлых любителей коротких видеороликов наблюдается повышенная активность в нейронных путях вознаграждения мозга, тех же самых, которые активируются при употреблении алкоголя или азартных игр

Что за "те же самые" пути? Частично это так, некоторые области совпадают с теми, что активируются при вознаграждении/аддикции, но совпадение по области не означает совпадение по механизму, по динамике нейромедиаторных изменений или клинической значимости.

Это довольно старая ошибка, проиллюсторировать которую можно следующим образом. Пианист использует пальцы для игры на инструменте, программист пишет код руками (не все), следовательно, пианист и программист занимаются тем же самым.

Проще говоря, эти безобидные клипы могут перегружать дофаминовую систему вашего мозга, притупляя его способность получать удовольствие

Без комментариев.

У авторов с Форбса получилось намного лучше, они даже корреляцию за каузацию не выдали.

Авторы исследования сосредоточились на биологической стороне этих процессов. Оказалось, что в мозге тех, кто сильнее других подвержен зависимости, происходят структурные и функциональные изменения. Они касаются зон, отвечающих за получение удовольствия, принятие решений и эмоциональную регуляцию — орбитофронтальной коры и мозжечка. В этих областях увеличивается объем серого вещества, что обостряет восприятие и может провоцировать компульсивный просмотр.

А если коротко об исследовании, то:

Авторы исследовали short video addiction — склонность к навязчивому просмотру коротких видеороликов — и пытались связать поведенческие проявления с нейроанатомическими, функциональными и молекулярно-транскриптомными характеристиками мозга. То есть проверяли, связана ли привычка смотреть короткие ролики с изменениями в строении и работе мозга и активностью определённых генов.

Выборка в 111 человек. Студентов. С использованием поведенческой оценки, нейровизуализации, статистики и транскриптономики.

Нашли корреляцию между склонностью к SVA и показателями "dispositional envy". То есть есть корелляция между склонностью смотреть короткие видео и завистью. Эффект маленький (r ~ .45).

Нашли положительную корреляцию SVA с увеличением объема в орбитофронтальной коре и в некоторых участках мозжечка.

Обнаружили повышенную спонтанную активность и согласованность межсубъектных паттернов в DLPFC, PCC, мозжечке, которая ассоциировалась с тяжестью SVA.

С генетикой я не в ладах, поэтому сами читайте чё там по генетике.

Собственно, ни слова про то, что TikTok разжижает мозги, что это дешёвый дофамин и прочее. Это исследование носит корреляционный характер, проведено на небольшой гомогенной выборке, на студентах (соответственно, требует репликаций в более крупных и разнообразных выборках). В исследовании вообще не проводились PET или прямые измерения дофамина или рецепторов.

Утвеждения о десенситизации дофаминовой системы и сходности механизмов SVA с алкогольной зависимостью там проскакивают, но это ссылки и выводы из других исследований.


Это, конечно, ужасно, что дети смотрят короткие ролики, а не занимаются наукой / зарабатыванием денег / помывкой полов / чисткой и варкой картошки. Мозг от коротких роликов не страдает, страдает перспектива. Время — самый ценный и невосполнимый ресурс, который есть у человека. Чрезмерная, избыточная трата времени на "бесполезные" занятия — вот действительный негативный эффект.

Показать полностью
7

Action Prediction Error (APE) — отдельный сигнал обучения

Серия Дофамин и все-все-все

В представлении среднего гражданина дофамин является гормоном удовольствия. Чуть менее средние граждане знают, что дофамин кодирует ошибки предсказания. В основном исследования были сконцентрированы на ошибке предсказания вознаграждения, но если они вас утомили, то предлагаю почитать свежие исследования об ином типе ошибок предсказания.

Коротко

Action prediction error (APE) — это ошибка предсказания, связанная не с ценностью вознаграждения (как reward prediction error), а с предсказанием самого действия. Недавние эксперименты показали, что дофамин в хвосте стриатума кодирует APE и служит «value-free» обучающим сигналом, который укрепляет повторяющиеся ассоциации «состояние — действие». Вместе с классическим RPE эти два сигнала работают в паре: RPE ориентируется на ценность, а APE формирует привычки и автоматические действия.


Новое платье старого короля

Классическая идея об ошибке предсказания была довольно простой и красивой: мозг сравнивание ожидание и реальность, а разница используется для обновления знаний. Традиционно внимание концентрировалось на ошибке предсказания вознаграждения и роли дофамина в её кодировании. Однако поведенические данные и теория давно намекали, что животные учатся не только на том, что приносит награду (и удовольствие, как частный случай), но и на повторяющихся конкретных действиях независимо от немедленной ценности.

APE — это попытка дать нейрофизиологическую и вычислительную форму вышеупомянутому способу обучения.

Что за зверь этот ваш APE?

Action prediction error — это сигнал, фиксирующий разницу между фактически выполненным действием и тем действием, которое система ожидала выполнить. В отличие от RPE, который обновляет значения состояний или действий на основе вознаграждения, APE укрепляет саму связь «состояние — действие».

Ключевые выводы последних работ (публикации на bioRxiv и в Nature):

  1. Наблюдение APE в дофаминергических сигналах. В задаче аудиальной дискриминации у мышей движение-связанные всплески дофамина в хвосте стриатума соответствовали предсказанным/непредсказанным действиям, а не прямо значению вознаграждения.

  2. Каузальность. Оптогенетические и иные манипуляции с этими сигналами изменяли обучение так, как ожидалось. Вмешательство нарушало закрепление повторяющихся ответов, но не моделировало привычное обновление ценностей. Это отличает APE от RPE по функциональным последствиям.

  3. Модель и взаимодействие с RPE. Компьютерные модели и анализы показали, что APE-сигнал сам по себе не достаточен для обучения, основанного на вознаграждении; однако в тандеме с RPE он стабилизирует и консолидирует устойчивые ассоциации «звук — действие». То есть две системы дополняют друг друга.

Ограничения

Во-первых, большая часть данных набрана на мышах.

Во-вторых, дофамин — это не монолит: разные субпопуляции нейронов, разные терминалы могут кодировать разные свойства. Собственно, данные модели в очередной раз показывают, что дофамин работает в десятки раз сложнее, чем себе представляют средние граждане.

Показать полностью
Отличная работа, все прочитано!

Темы

Политика

Теги

Популярные авторы

Сообщества

18+

Теги

Популярные авторы

Сообщества

Игры

Теги

Популярные авторы

Сообщества

Юмор

Теги

Популярные авторы

Сообщества

Отношения

Теги

Популярные авторы

Сообщества

Здоровье

Теги

Популярные авторы

Сообщества

Путешествия

Теги

Популярные авторы

Сообщества

Спорт

Теги

Популярные авторы

Сообщества

Хобби

Теги

Популярные авторы

Сообщества

Сервис

Теги

Популярные авторы

Сообщества

Природа

Теги

Популярные авторы

Сообщества

Бизнес

Теги

Популярные авторы

Сообщества

Транспорт

Теги

Популярные авторы

Сообщества

Общение

Теги

Популярные авторы

Сообщества

Юриспруденция

Теги

Популярные авторы

Сообщества

Наука

Теги

Популярные авторы

Сообщества

IT

Теги

Популярные авторы

Сообщества

Животные

Теги

Популярные авторы

Сообщества

Кино и сериалы

Теги

Популярные авторы

Сообщества

Экономика

Теги

Популярные авторы

Сообщества

Кулинария

Теги

Популярные авторы

Сообщества

История

Теги

Популярные авторы

Сообщества