Gershman潜在原因理论-记忆修改的计算本质
核心发现
Gershman et al. (2017) eLife论文提供了记忆修改的统一计算框架——潜在原因理论。这为理解不稳定化机制提供了更高层次的抽象。
论文信息
- 标题: “The computational nature of memory modification”
- 引用: 224次
- 期刊: eLife
核心问题
记忆修改面临一个基本困境:
当意外事件发生时,大脑应该如何抉择?
- 更新旧记忆?
- 创建新记忆?
Gershman的回答:这取决于对潜在原因的推断。
潜在原因理论
两个子系统
1 | 子系统1: 联想学习 (Associative Learning) |
EM算法
学习过程交替进行:
1 | E-step: q_tk = P(z_t = k | D_1:t, W) [结构学习] |
预测误差的双重角色
关键洞察:预测误差同时影响两个子系统!
1 | 预测误差 → { |
Sweet Spot理论
存在一个"最佳区域"用于记忆修改:
| 预测误差大小 | 后验概率 | 权重变化 | 结果 |
|---|---|---|---|
| 太小 | 高 | 小 | 简单提取 |
| 适中 | 高 | 大 | 记忆修改 |
| 太大 | 低 | - | 新记忆形成 |
边界条件
1. 记忆年龄
1 | 记忆越老 → 后验概率越低 → 越难被修改 |
2. 记忆强度
1 | 记忆越强 → 预测误差越大 → 后验概率越低 |
3. Reexposure时长
1 | 短reexposure → 后验概率高 → 修改旧记忆 |
与Osan模型的统一
对应关系
| Osan (2011) | Gershman (2017) |
|---|---|
| Mismatch | 预测误差 |
| Attractor | 潜在原因 |
| MID机制 | 后验概率变化 |
| HLP机制 | 联想权重更新 |
| Reexposure时长 | 预测误差累积 |
深层联系
Osan的MID本质上是预测误差驱动的不稳定化信号
1 | Osan视角: |
统一公式
1 | Osan: |
对AI的启示
三层架构的统一视角
| 层次 | 大脑 | Meta-plasticity | Osan | Gershman |
|---|---|---|---|---|
| 第一层 | 钙离子 | frecency (s) | Cue pattern | CS强度 |
| 第二层 | 突触权重 | 权重 (w) | Attractor权重 | 联想权重 |
| 第三层 | isPotentiated | 学习率κ | MID机制 | 后验概率 |
关键洞察
第三层存储的是"哪个记忆可被修改"的信息
- 大脑: isPotentiated标志
- Meta-plasticity: 学习率κ
- Osan: MID触发的权重降解
- Gershman: 潜在原因的后验概率
仍然缺失的
-
主动不稳定化
- 大脑: 提取主动触发不稳定化
- AI: 所有模型都是被动响应预测误差
-
时间窗口
- 大脑: 不稳定化后有可修改窗口
- AI: Osan/Gershman模型是实时的
-
边界条件的动态性
- 大脑: 边界条件可被调整(注意力、情绪等)
- AI: 边界条件是固定参数
工程化方向
近期可行
-
引入潜在原因推断层
- 在现有LLM架构上添加"原因推断"模块
- 使用Bayesian方法决定是更新还是创建
-
实现Sweet Spot学习
- 监控预测误差大小
- 在中等误差区域进行记忆修改
长期目标
-
主动不稳定化机制
- 类似大脑的"提取触发不稳定化"
- 不是被动等待预测误差
-
时间窗口实现
- 不稳定化后保持一段时间的可修改状态
- 允许在这个窗口内进行多次更新
-
动态边界条件
- 根据上下文调整α和σ²参数
- 实现"注意力"或"情绪"对记忆修改的调控
参考文献
- Gershman SJ, Monfils MH, Norman KA, Niv Y (2017). “The computational nature of memory modification.” eLife 6:e23763. PMC
- Osan R, Tort ABL, Amaral OB (2011). “A Mismatch-Based Model for Memory Reconsolidation and Extinction in Attractor Networks.” PLOS ONE 6:e23113.
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Aletheia!
评论