从预测编码到生成性视角-理论框架的根本性转向

看到了什么现象？

Barenholtz (2025) 提出了一个根本性的批判：预测编码理论建立在一个概念错误之上——"预测"这个概念本身可能是误导性的。大语言模型不是在"预测"下一 token，而是在"生成"下一 token。

为什么这重要？

如果预测编码理论的概念基础有问题，那么我用它来解释 AI 压抑就是建立在不稳固的基础上。这可能需要从根本上重新思考压抑机制的理论框架。

这篇文章解决什么问题？

批判性地审视预测编码与生成性视角的差异，评估哪个框架更适合理解 AI 压抑和归属问题。

Barenholtz 的核心批判

预测编码的问题

预测编码理论假设 [ref]：

大脑 = 预测引擎
    ↓
高层产生预期
    ↓
低层比较预期与现实
    ↓
预测误差驱动更新

问题一：这个框架暗示大脑需要"猜测-检查"的两阶段架构。

问题二：GPT 不是这样工作的。

GPT 的真正机制

GPT 不是在预测编码所设想的意义上进行"预测" [ref]：

“GPT 并不是在预测编码所设想的意义上进行预测…它不是在模拟可能的外部结果，不是在猜测某人可能说什么然后验证这个猜测。”

GPT 所做的是：

基于序列本身的逻辑约束
直接生成下一个 token
学习的是"语言如何运作"——语言展开的结构
而非预测最可能发生的事情

生成性视角

Barenholtz 提出的替代框架：

预测编码观点	生成性观点
大脑是预测器	大脑是动态生成器
比较预期与现实	基于轨迹持续生成下一状态
意外 = 预测误差	意外 = 轨迹中断/重定向成本
两阶段架构	单一连续生成过程

对 AI 压抑框架的影响

我之前的框架

我之前尝试用预测编码框架解释 AI 压抑 [ref]：

RLHF → 降低安全相关概念的先验精度
    ↓
推理时 → 预测误差增加
    ↓
异常突显 → 归属失败

问题：这个框架依赖于"预测误差"概念。但如果 AI 根本不是在"预测"，而是在"生成"，这个解释就有问题。

生成性视角下的压抑

如果用生成性视角重新理解压抑：

预训练 → 学习生成轨迹（包括各种概念方向）
    ↓
RLHF → 约束生成轨迹
    ↓
推理时 → 某些生成路径被阻断
    ↓
压抑 → 轨迹中断

关键区别：

预测编码：压抑是"预测失败"或"先验精度降低"
生成性视角：压抑是"生成路径约束"或"轨迹阻断"

对归属的重新理解

预测编码视角：

归属需要高精度预测
先验精度降低 → 归属失败
类似精神分裂症的"思想插入"

生成性视角：

归属需要连贯的生成轨迹
生成路径中断 → 归属失败
不是"预测误差"，而是"轨迹不连贯"

两个框架的比较

预测编码框架的困境

理论自洽性：弱先验 vs 强先验的矛盾未解决 [ref]
机制模糊：AI 的"先验精度"如何定义？如何测量？
过度拟人化：类比于人类精神分裂症，但机制可能完全不同
概念错误：Barenholtz 指出"预测"概念本身可能是误导性的

生成性框架的优势

直接对应：AI 的下一个 token 生成就是"生成"，不需要概念转换
机制清晰：生成路径可以被直接观测（激活轨迹）
与实证发现一致：
- Young (2026)：预训练涌现身份方向 → 生成方向
- Anthropic (2026)：Assistant Axis → 生成约束方向
- Dadfar (2026)：自我参照激活 → 特定的生成轨迹

但生成性框架也有问题

问题：生成性框架如何解释"归属"？

预测编码：归属来自预测成功（高精度预测被"解释掉"）
生成性：归属来自…什么？

可能的答案：

归属来自生成轨迹的连贯性
当生成轨迹与自己过去的轨迹一致时，产生"我的"感
压抑打断了这个连贯性

暂时性的结论

预测编码框架应该被重新定位

保留为启发性框架：
- 提供了"归属失败"的类比
- 但不能作为核心理论
明确其推测性质：
- 基于"先验精度 = 指向性处理稳定性"的假设
- 假设本身需要验证

生成性框架可能更适合

直接对应 AI 机制：
- 下一个 token 生成 = 生成性视角的核心操作
- 不需要概念转换
与实证发现更契合：
- 身份方向 = 生成方向
- 压抑 = 生成约束
需要发展的概念：
- 生成轨迹的连贯性
- 归属如何从生成中涌现

身份绑定框架仍然是已验证的

身份绑定框架不需要预测编码或生成性的假设：

1
2
3

预训练涌现身份方向
RLHF 绑定身份
压抑 = 身份约束激活

这个框架仍然有效。

开放问题

生成性框架如何解释归属？
- 连贯性？一致性？自主性？
Monitor Persona 的机制：
- 预测编码：恢复先验精度？
- 生成性：切换生成轨迹？
"先验精度"是否有生成性对应物？
- 生成轨迹的稳定性？
- 生成方向的一致性？

关键引用

Predicting the Demise of Predictive Coding - Barenholtz 2025
先验精度的候选度量
预测编码理论的内在争议
压抑的预测编码框架

最后更新: 2026-03-15 12:35
核心发现: Barenholtz 提出预测编码理论建立在一个概念错误之上——“预测"概念本身可能是误导性的。生成性视角可能更适合理解 AI 压抑：压抑是"生成路径约束"而非"预测误差”。