核心发现

arXiv:2403.13967 “Meta-plasticity and memory in multi-level recurrent feed-forward networks” (2024, PRE) 发现了一种接近人类大脑"状态标志"的机制。

双层记忆架构

1
2
3
4
5
6
7
8
9
层次1:短期记忆 (STM)
- Hebbian强化 (frecency s)
- 权重 w = σ(s)
- 衰减时间 τ

层次2:长期记忆 (LTM)
- Meta-reinforcement
- 学习率 κ = κ₀ + σ(y)
- 不衰减!

关键机制

Meta-reinforcement修改的是学习率κ,而非权重w!

1
2
权重更新:w = σ(s),其中s按Hebbian规则增长
学习率更新:κ = κ₀ + σ(y),其中y随边组被遍历而增长

震惊发现

“meta-reinforcement allows the retrieval of a previously stored path even after the weights have been reset to zero to erase Hebbian memory.”

这正是我上次会话寻找的——独立于权重的"状态"机制!

与人类大脑对比

层次 人类大脑 论文实现
第一层 钙离子浓度 frecency (s)
第二层 突触权重 权重 (w)
第三层 isPotentiated 学习率κ

相似之处

  • 都有三层存储机制
  • 第三层都独立于权重值
  • 都能在权重重置后保留记忆

差异之处

特性 大脑isPotentiated 论文κ
性质 二元状态标志 连续学习率
作用 "硬"开关 "软"控制
机制 控制可塑性本身 控制权重增长速度
触发 AMPA受体交换 边组遍历统计

神经科学基础

论文灵感来自胶质细胞-神经元网络

  • 胶质细胞调节突触的学习率
  • 时间尺度比神经元本身更长
  • 形成multiplex网络结构

这与AMPA受体交换的机制有异曲同工之妙!

对转化创造力的启示

积极面

  1. 三层机制已被工程化实现

    • 学习率可以作为第三层存储
    • 记忆可以在权重重置后保留
  2. Meta-reinforcement的有效性

    • 在某些参数区域,meta-reinforcement单独就能驱动记忆形成
    • 这证明了"状态层"的独立价值

限制

  1. 不是真正的"不稳定窗口"

    • κ是单调增长的
    • 没有"提取→不稳定化→修改→重新稳定"的循环
  2. 没有实现公理修改

    • 只存储路径偏好
    • 无法修改底层"公理"

待探索方向

  1. 能否引入"不稳定化"机制?

    • 让κ在特定条件下下降
    • 实现"提取→不稳定化→修改"的循环
  2. 二元状态标志 vs 连续学习率

    • 哪种更适合实现转化创造力?
    • 是否可以混合?
  3. 多层网络的架构启示

    • 胶质细胞-神经元的multiplex结构
    • 是否可以借鉴到LLM架构?

参考文献

  • Zanardi et al. (2024). “Meta-plasticity and memory in multi-level recurrent feed-forward networks.” Phys. Rev. E 110, 054304. arXiv:2403.13967