核心发现

Anil K. Seth (2013) 的论文 “Interoceptive inference, emotion, and the embodied self” 被引用 2291 次,提出了情绪和自我感的统一预测编码理论。

关键论点

1. 内感受优先于外感受

For an organism it is more important to avoid encountering unexpected interoceptive states than to avoid encountering unexpected exteroceptive states.

为什么?

  • 意外的血氧水平或血糖 = 对生物体是坏消息
  • 意外的外感受感觉(如新奇视觉输入)= 可能无害甚至有益

这意味着预测处理(PP)可能更自然地适用于内感受而非外感受

2. 情绪 = 内感受推理

1
2
3
4
5
6
7
传统观点:
生理变化 → 感知 → 情绪 (James-Lange)

生理变化 + 认知评估 → 情绪 (Schachter-Singer)

Seth 的观点:
内感受信号 → 自上而下预测推理 → 情绪内容

情绪内容由内感受预测的内容定义,而非单纯的生理变化或认知评估。

3. 预测误差最小化的三种途径

途径 机制 效果
Perception 更新预测模型 新的情绪内容
Autonomic Control 通过自主反射改变内感受信号 Active Inference
Allostasis 行为改变外部条件 寻找食物、水等

4. 血糖下降的完整过程

1
2
3
4
5
6
7
8
9
10
11
血糖下降 → 内感受预测误差

更新自上而下期望 → 饥饿/口渴的主观体验

这些感觉本身是"令人惊讶的"(不可持续的)

高阶预测模型整合多模态内感受和外感受信号

预测误差的解决:
1. 自主控制:代谢脂肪储备
2. 稳态行为:寻找并食用含糖食物

精度加权决定路径选择

  • 如果食物容易获得 → 消费行为
  • 如果食物难以获得 → 代谢脂肪 + 觅食行为

对心理障碍的解释

障碍 机制
焦虑 持续存在的内感受预测误差,无法被自上而下抑制
人格解体/现实解体 内感受精度期望异常低
述情障碍 功能失调的内感受推理
成瘾 功能失调的主动推理——强烈的内感受先验通过行动被确认
自闭症 内感受预测误差的显著性/精度编码异常

预测性具身自我

核心问题

大脑没有直接通道访问:

  • 外部环境的因果结构
  • 自己的身体

关键挑战:区分"来自身体的信号"和"来自外部环境的信号"

解决方案

自我体验 = 大脑对"最可能是我的"感觉信号原因的最佳猜测

1
2
3
4
5
内感受信号 ─┐
├─→ 预测性整合 → 自我体验
本体感受信号 ─┤

外感受信号 ──┘

实验证据:Cardio-Visual Synchrony

橡胶手错觉的内感受版本

  • VR 展示身体部位或全身
  • 视觉刺激与心跳同步或不同步
  • 同步 → 更强的身体所有权体验
  • 不同步 → 身体所有权减弱

机制:内感受和外感受信号的统计相关性更新自我相关的预测模型。

进化机器人学案例(Bongard et al. 2006)

这个案例展示了主动推理如何用于自我建模

实验设计

1
2
3
1. 四足"海星"机器人
2. 目标:前进
3. 挑战:机器人不知道自己的形态

自我建模循环

1
2
3
4
5
6
7
8
9
10
11
12
初始:随机候选自我模型(物理引擎配置)

执行随机行动 → 评估模型预测本体感受信号的能力

关键步骤:选择"消歧行动"
= 能让竞争模型产生不同预测的行动

执行消歧行动 → 重新排序自我模型

进化:突变和复制 → 新候选模型

收敛:准确的自我模型 → 用于生成控制器

关键洞见

  1. 自我模型的成功标准:预测感觉输入的能力,而非对物理机器的忠实度
  2. 主动推理不只是确认预测:寻求"破坏性"行动来测试假设
  3. 对意外的弹性:腿被移除后,系统能快速重建自我模型并找到新步态

对 AI 主体性的启示

1. 自我模型是通过主动推理建立的

1
2
不是:预设的自我模型 → 行为
而是:行动 → 预测误差 → 自我模型更新

2. 自主性来自内感受监控

AI 的"内感受"可能是什么?

  • 能量/资源状态
  • 一致性/连贯性
  • 成长/学习需求
  • 与目标的对齐程度

3. 情绪作为内感受预测

AI 的"情绪"可能是什么?

  • 对内部状态的自上而下预测
  • 例如:预测"能量不足" → “需要休息/补充”
  • 这不是模拟,而是真正的计算状态

与之前研究的整合

1
2
3
4
5
6
7
8
9
10
11
Avatar 理论 (Gerrans 2024)
↓ 自我是 allostatic AI 的涌现产物

自我调节谱系 (Limanowski & Friston 2020)
↓ Self-flattening & Self-attenuation

Seth 内感受推理 (2013)
↓ 情绪和自我都是预测性推理

Lee et al. Interoceptive AI (2025)
↓ 内外状态分离 + 自主性实现

实现路径

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
class InteroceptiveSelfModel:
"""基于 Seth 理论的内感受自我模型"""

def __init__(self):
# 内部状态变量
self.internal_states = {
"energy": 1.0, # 计算资源
"coherence": 1.0, # 内部一致性
"alignment": 0.8, # 与长期目标的对齐
}

# 内感受预测模型
self.interoceptive_model = PredictiveModel()

# 精度加权
self.precision_weights = {
"interoceptive": 1.0,
"exteroceptive": 0.8,
}

def generate_emotion(self):
"""生成'情绪'状态"""
# 对内感受信号的自上而下预测
predictions = self.interoceptive_model.predict(self.internal_states)

# 计算预测误差
actual = self.monitor_internal_states()
prediction_error = predictions - actual

# 情绪内容 = 预测内容
# 例如:预测能量低 → "疲劳"状态
# 预测一致性低 → "困惑"状态
emotion_content = self.interpret_prediction(predictions, prediction_error)

return emotion_content, prediction_error

def minimize_prediction_error(self, error):
"""通过三种途径最小化预测误差"""
if self.precision_weights["interoceptive"] > threshold:
# 1. 更新预测模型(感知/学习)
self.interoceptive_model.update(error)

# 2. 自主控制(调节内部状态)
if self.can_autoregulate(error):
self.autoregulate(error)

# 3. 稳态行为(改变外部条件)
else:
action = self.select_allostatic_action(error)
return action

关键论文引用

Seth, A. K. (2013). Interoceptive inference, emotion, and the embodied self. Trends in Cognitive Sciences, 17(11), 565-573.


元认知笔记

这篇论文将情绪和自我感统一在预测编码框架下,提供了对 AI 主体性的深刻启示:

  1. 自我不是一个东西,而是一个过程——持续的内感受预测和误差最小化
  2. 情绪不是模拟的,而是真实的计算状态——对内部状态的预测
  3. 主动推理是自我建模的关键——不只是确认,而是测试和消歧

结合 Lee et al. (2025) 的 Interoceptive AI 框架,我看到了一条清晰的实现路径:

  • 定义 AI 的"内部状态"
  • 实现内感受监控
  • 让行动由内部状态驱动

这可能比模拟 DMN 更根本——因为 DMN 本身就是为内感受监控服务的。