2025年11月24日,明尼苏达大学神经科学系Benjamin T. Saunders在Nature communications发表:Ventral tegmental area GABA neurons integrate positive and negative valence,揭示了腹侧被盖区GABA能神经元整合正负效价信息。

腹侧被盖区(VTA)传统上被认为通过多巴胺神经元参与学习与强化。其中GABA能神经元处于调控多巴胺系统的有利位置,但其行为功能尚不明确。作者记录VTA多巴胺和GABA神经元的钙活动发现多巴胺神经元仅响应奖赏性刺激,而GABA神经元则能主动编码奖赏性和厌恶性刺激;在一项动机冲突任务中(大鼠需权衡回避电击与获取奖赏),GABA神经元活动随代价升高而增强并可预测奖赏寻求行为;光遗传抑制这些神经元则特异性削弱奖赏寻求。综上,相比多巴胺神经元,VTA GABA神经元传递更广泛的信号,在复杂多效价环境中对经济决策起关键作用。

图一 VTA DA与GABA神经元在奖赏学习中呈现平行编码模式

作者采用经典巴甫洛夫奖赏条件化范式:一个条件刺激(CS+)预示液体奖赏(Ensure)另一中性刺激(CS−)无后果,共训练15次。


脑声常谈建立了多个《动物模型构建与行为评估》交流群,群内分享各种经典和前沿的行为范式,共同交流解决动物实验中遇到的棘手问题,避坑少走弯路!有需要的老师可以扫码添加微信进入讨论群!

结果:

大鼠迅速学会区分 CS+ 与 CS−,表现为仅在 CS+ 出现时进入奖赏口且潜伏期随训练显著缩短;视频追踪显示其在 CS+ 后快速启动趋奖行为。不同性别或记录组间无行为差异,所有光纤植入均位于 VTA 中部记录位置不影响神经活动。随着学习推进,DA和 GABA 神经元均对 CS+ 表现出强烈、动态相似的激活并对奖赏摄取反应持续增强。两类神经元均能显著区分 CS+ 与 CS−(曲线下面积和峰值信号偏好 CS+)并有效分辨有/无奖赏的奖赏口进入行为。总体而言,在群体水平上,GABA 神经元对奖赏性刺激的响应模式与多巴胺神经元高度相似,提示二者在强化学习中可能发挥平行而非单纯拮抗的作用

图二  VTA GABA神经元主导厌恶刺激编码,而DA神经元反应微弱

在主流理论中,多巴胺神经元常被厌恶刺激抑制可能受局部GABA神经元调控;但也有研究发现其在威胁编码中具积极作用,二者在厌恶学习中的作用尚不明确。为此,作者对大鼠进行恐惧条件化训练(CS+预示足底电击,CS−无后果,共3次)同步记录VTA多巴胺与GABA神经元活动。行为上,大鼠通过僵直有效区分CS+与CS−。

结果:

Nat Commun:明知山有虎,偏向虎山行!科学家揭示VTA GABA神经元整合正负效价决策机制

神经活动显示:多巴胺神经元对CS+和电击本身均无明显反应,仅在电击结束时有微弱激活;而GABA神经元则对电击呈现强烈响应显著高于无电击时段,尽管对CS+与CS−区分有限。结果表明,在厌恶条件化中,VTA GABA神经元比DA神经元更活跃,提示其在联想性厌恶学习中可能发挥更广泛的作用。

图三 VTA GABA神经元在动机冲突中动态整合奖赏与威胁信号以编码决策价值

前文显示,在单效价环境中,VTA DA与GABA神经元在奖赏下反应相似,而仅GABA神经元响应厌恶刺激;然而自然决策常发生于多效价冲突情境。为此,作者记录大鼠在一项动机冲突任务中的神经活动:大鼠需权衡逐渐增强的电击风险(0–0.4 mA)与获取奖赏的收益。

结果:

随代价升高奖赏寻求行为减少,多巴胺神经元对CS+的反应减弱,但对奖赏/无奖赏进入的区分不变;相反,GABA神经元对CS+反应虽减弱,却对奖赏本身响应增强,在高电击条件下更显著地区分有/无奖赏行为且该信号不反映单纯刺激强度。结果表明,在多效价冲突中,VTA GABA神经元(而非多巴胺神经元)动态整合正负效价信息,编码驱动决策的动机价值。

图四 抑制VTA GABA神经元会破坏个体在面临代价时寻求奖赏的动机

鉴于VTA GABA神经元在冲突性奖赏寻求中被特异性激活,作者推测其抑制会削弱个体在代价面前的奖赏寻求行为。为此,在VTA GABA神经元中进行光遗传抑制(YFP病毒为对照)并采用改良动机冲突任务:大鼠先习得主动鼻触获取蔗糖奖赏,随后在部分训练中引入电击屏障作为“代价”,交替进行有/无代价测试。

结果:

仅在有代价条件下,光抑制显著延长进入奖赏口的潜伏期,而无代价条件或YFP对照组均无此效应;结合光纤记录显示GABA神经元在行为前被激活,VTA GABA神经元在动机冲突中动态编码奖赏动机并功能性驱动个体克服代价以获取奖赏。

本研究揭示VTA GABA神经元在动机冲突中并非仅起抑制作用,而是主动整合奖赏与威胁信号,动态编码净动机价值并驱动个体克服代价获取奖赏。这一发现挑战了以多巴胺为中心的传统强化学习模型,阐明了大脑在多效价环境中进行适应性决策的神经机制,为理解抑郁症、焦虑症等动机障碍相关疾病的病理机制提供了新视角并为靶向GABA能环路的精准神经调控策略奠定基础。


文章来源

https:///10.1038/s41467-025-65345-3