大脑里的“预测家”:海马体如何学会预知未来奖赏?
发布时间:2026-01-16 11:54 浏览量:2
大脑就像一位聪明的“预言家”,能够不断学习如何根据当前情况预测未来可能发生的好事。最近,一项发表在《自然》杂志上的研究揭开了大脑中负责记忆和导航的重要区域——
海马体
——是如何一步步从“记录奖赏”转变为“预测奖赏”的。
一、大脑如何“预知”好事?关键在于海马体的动态变化
我们的大脑天生爱“猜未来”。这项由麦吉尔大学Mark P. Brandon团队进行的研究发现,海马体不仅仅是一个记录过去经历和空间位置的“记事本”,它更像是一个
会学习的预测系统
。
研究人员让小鼠在几周时间里学习一项视觉触屏任务:屏幕上出现特定图案后,小鼠需要做出正确选择才能获得奖励。在此过程中,科学家利用微型显微成像技术,长期追踪小鼠海马体中数百个神经元的活动变化。
研究最核心的发现是:随着小鼠越来越熟练,海马体的工作方式发生了有趣的转变:
✅
从“记录好事”到“关注线索”
:一开始,海马神经元主要在
获得奖励的时刻
活跃;但学习后,它们更多地在
看到奖励线索(比如屏幕提示)时就提前活跃起来
。
✅
信号在时间上“向后倒推”
:很多神经元的活跃高峰,从“奖励到来时”逐渐提前到了“奔向奖励的路上”甚至“看到线索时”。
✅
预测能力增强,反应强度减弱
:对奖励本身直接反应的信号变弱了,但对预测性线索的编码却越来越强、越来越精准。
简单说,海马体学会了:
不必等到好事发生才兴奋,看到“前兆”就能提前准备。
二、实验怎么做?看小鼠玩“找奖励”游戏
为了观察海马体在学习中的变化,研究团队设计了一套巧妙的实验:
1. 成像技术:看神经元“亮起来”
在小鼠海马体植入超薄的微型显微镜,让神经元活动时发出的荧光能被实时记录。
跨实验累计追踪了超过
1800个神经元
。
2. 行为任务:小鼠的“触屏挑战”
小鼠面对一个带触摸屏的装置,屏幕会随机在一侧显示一个方块。
小鼠需要用鼻子触碰方块,然后经过一段等待时间,再跑到装置另一侧做出正确选择(选择与之前不同的方块),才能获得一滴甜水奖励。
随着小鼠越做越好,等待时间会逐渐加长,任务难度提升,确保小鼠一直处于“学习状态”。
三、发现了什么?三张图看懂海马体的“预测升级”
图1:海马体中有不同类型的“专家神经元”
研究发现,海马体里住着不同分工的细胞:
奖励细胞
:主要在喝到甜水时活跃。
屏幕选择细胞
:在看到屏幕图案、做选择时活跃。
奖励接近细胞
:在从屏幕跑向奖励口的路上活跃。
随着学习,后两种“预测型”细胞的比例逐渐增加。
图2:学习的本质是“增强预测,减弱反应”
群体分析显示,随着训练天数增加和表现变好,神经元群体对
屏幕线索
和
跑向奖励
这些“奖励前事件”的编码信息量显著增强。
相反,整个群体对
奖励本身
的反应强度则随学习减弱。
这说明海马体的编码重心,从“发生了什么”转向了“将要发生什么”。
图3:神经活动的“时光倒流”——向后偏移
这是最有趣的现象!许多
奖励细胞
的活动峰值,随着学习一天天发生
时间上的提前
(即“向后偏移”)。
约
21% 的奖励细胞
表现出显著的偏移,其中超过一半最终“转型”成了屏幕选择细胞或奖励接近细胞。
与此同时,神经活动的强度也在普遍减弱,共同导致了奖励直接表征的淡化。
四、总结:海马体是一个“动态预测地图”
这项研究揭示,海马体远不止是空间地图,它更是一个
随经验不断更新的“预测性地图”
。其核心功能是通过
将表征从结果(奖励)转移到预测线索(前兆)
,来支持学习和未来行为的优化。
通俗理解
:就像你第一次走进一家咖啡馆,得到一杯好喝的咖啡(奖励)时很开心,相关记忆会形成。但去了几次后,你一闻到咖啡香(线索)甚至看到店招牌(更早的线索)时,大脑就已经开始愉悦和期待了。海马体就在完成这种从“回味美好”到“预见美好”的神经机制升级。
科学意义
:这一“向后偏移”机制,为理解大脑如何通过经验构建内部预测模型、如何优化决策以适应环境,提供了重要的神经科学证据。
参考文献:
Yaghoubi M, Kumar MG, Nieto-Posadas A, Mosser CA, Gisiger T, Wilson É, Pehlevan C, Williams S, Brandon MP. Predictive coding of reward in the hippocampus. Nature. 2026 Jan 14. doi: 10.1038/s41586-025-09958-0. Epub ahead of print. PMID: 41535460.