大脑里的“预测家”:海马体如何学会预知未来奖赏?

发布时间:2026-01-16 11:54  浏览量:2

大脑就像一位聪明的“预言家”,能够不断学习如何根据当前情况预测未来可能发生的好事。最近,一项发表在《自然》杂志上的研究揭开了大脑中负责记忆和导航的重要区域——

海马体

——是如何一步步从“记录奖赏”转变为“预测奖赏”的。

一、大脑如何“预知”好事?关键在于海马体的动态变化

我们的大脑天生爱“猜未来”。这项由麦吉尔大学Mark P. Brandon团队进行的研究发现,海马体不仅仅是一个记录过去经历和空间位置的“记事本”,它更像是一个

会学习的预测系统

研究人员让小鼠在几周时间里学习一项视觉触屏任务:屏幕上出现特定图案后,小鼠需要做出正确选择才能获得奖励。在此过程中,科学家利用微型显微成像技术,长期追踪小鼠海马体中数百个神经元的活动变化。

研究最核心的发现是:随着小鼠越来越熟练,海马体的工作方式发生了有趣的转变:

从“记录好事”到“关注线索”

:一开始,海马神经元主要在

获得奖励的时刻

活跃;但学习后,它们更多地在

看到奖励线索(比如屏幕提示)时就提前活跃起来

信号在时间上“向后倒推”

:很多神经元的活跃高峰,从“奖励到来时”逐渐提前到了“奔向奖励的路上”甚至“看到线索时”。

预测能力增强,反应强度减弱

:对奖励本身直接反应的信号变弱了,但对预测性线索的编码却越来越强、越来越精准。

简单说,海马体学会了:

不必等到好事发生才兴奋,看到“前兆”就能提前准备。

二、实验怎么做?看小鼠玩“找奖励”游戏

为了观察海马体在学习中的变化,研究团队设计了一套巧妙的实验:

1. 成像技术:看神经元“亮起来”

在小鼠海马体植入超薄的微型显微镜,让神经元活动时发出的荧光能被实时记录。

跨实验累计追踪了超过

1800个神经元

2. 行为任务:小鼠的“触屏挑战”

小鼠面对一个带触摸屏的装置,屏幕会随机在一侧显示一个方块。

小鼠需要用鼻子触碰方块,然后经过一段等待时间,再跑到装置另一侧做出正确选择(选择与之前不同的方块),才能获得一滴甜水奖励。

随着小鼠越做越好,等待时间会逐渐加长,任务难度提升,确保小鼠一直处于“学习状态”。

三、发现了什么?三张图看懂海马体的“预测升级”

图1:海马体中有不同类型的“专家神经元”

研究发现,海马体里住着不同分工的细胞:

奖励细胞

:主要在喝到甜水时活跃。

屏幕选择细胞

:在看到屏幕图案、做选择时活跃。

奖励接近细胞

:在从屏幕跑向奖励口的路上活跃。

随着学习,后两种“预测型”细胞的比例逐渐增加。

图2:学习的本质是“增强预测,减弱反应”

群体分析显示,随着训练天数增加和表现变好,神经元群体对

屏幕线索

跑向奖励

这些“奖励前事件”的编码信息量显著增强。

相反,整个群体对

奖励本身

的反应强度则随学习减弱。

这说明海马体的编码重心,从“发生了什么”转向了“将要发生什么”。

图3:神经活动的“时光倒流”——向后偏移

这是最有趣的现象!许多

奖励细胞

的活动峰值,随着学习一天天发生

时间上的提前

(即“向后偏移”)。

21% 的奖励细胞

表现出显著的偏移,其中超过一半最终“转型”成了屏幕选择细胞或奖励接近细胞。

与此同时,神经活动的强度也在普遍减弱,共同导致了奖励直接表征的淡化。

四、总结:海马体是一个“动态预测地图”

这项研究揭示,海马体远不止是空间地图,它更是一个

随经验不断更新的“预测性地图”

。其核心功能是通过

将表征从结果(奖励)转移到预测线索(前兆)

,来支持学习和未来行为的优化。

通俗理解

:就像你第一次走进一家咖啡馆,得到一杯好喝的咖啡(奖励)时很开心,相关记忆会形成。但去了几次后,你一闻到咖啡香(线索)甚至看到店招牌(更早的线索)时,大脑就已经开始愉悦和期待了。海马体就在完成这种从“回味美好”到“预见美好”的神经机制升级。

科学意义

:这一“向后偏移”机制,为理解大脑如何通过经验构建内部预测模型、如何优化决策以适应环境,提供了重要的神经科学证据。

参考文献:

Yaghoubi M, Kumar MG, Nieto-Posadas A, Mosser CA, Gisiger T, Wilson É, Pehlevan C, Williams S, Brandon MP. Predictive coding of reward in the hippocampus. Nature. 2026 Jan 14. doi: 10.1038/s41586-025-09958-0. Epub ahead of print. PMID: 41535460.