元认知架构的两种范式:仲裁型 vs 反思型
核心问题
之前发现 现有置信度研究都将置信度视为"外部信号"。本次探索追问:是否有元认知架构真正实现"置信度注入"?
探索发现
两种元认知架构范式
| 架构 | 范式 | 元认知角色 | 置信度使用 |
|---|---|---|---|
| SOFAI [ref] | 仲裁型 | 中央仲裁者 | 决定调用哪个求解器 |
| MeLA [ref] | 反思型 | 策略优化器 | 优化提示词(推理策略) |
SOFAI:仲裁型元认知
核心设计:受 Kahneman 双系统理论启发,显式分离 System 1(快)和 System 2(慢)
1 | 问题输入 → S1自动激活 → 提出方案+置信度 → 元认知仲裁 |
元认知模块的三重角色:
| 角色 | 功能 | 时机 |
|---|---|---|
| 实时MC | 在线仲裁选择求解器 | 每次决策 |
| 反思MC | 离线优化仲裁策略 | 轨迹完成后 |
| 学习MC | 更新模型和S1求解器 | 持续 |
仲裁算法核心:
1 | 信任度 = min(置信度, 历史无违规比例) |
与全局工作空间的关系:论文未直接引用 Shea 的全局工作空间理论,但存在概念相似性:
| 全局工作空间理论 | SOFAI 对应机制 |
|---|---|
| 全局广播 | 元认知模块向 S1/S2 传递决策 |
| 意识内容选择 | 元认知仲裁选择哪个求解器 |
| 工作记忆整合 | Self/World/Others 模型存储 |
MeLA:反思型元认知
核心设计:元认知驱动提示词演化,而非直接演化代码
1 | 问题 → 启发式生成+思考过程 → 评估 → 元认知反思 → 优化提示词 → 下一代 |
三个系统角色:
| 角色 | 职责 |
|---|---|
| 问题分析专家 | 分析问题特征,识别计算复杂性 |
| 精英代码调试器 | 定位执行错误,进行针对性修正 |
| 元认知反思者 | 内省思考过程,实现自我调节 |
元认知影响推理的方式:
三大目标驱动提示词优化:
- 强化:识别与适应度提升相关的推理模式
- 保留:隔离并保留高性能组件
- 创新:假设可能带来提升的新组件
关键洞察:
“优化’思考方式’而非’代码本身’”
与传统方法的对比:
| 维度 | 传统方法(EoH、ReEvo) | MeLA |
|---|---|---|
| 优化目标 | 启发式代码 | 生成启发式的推理过程 |
| 知识内化 | 不内化原则 | 内化"什么是优秀启发式"的原则 |
性能对比
| 问题 | EoH 成功率 | ReEvo 成功率 | MeLA 成功率 |
|---|---|---|---|
| ACS(真实世界) | 75.49% | 40.71% | 94.07% |
| WSN(真实世界) | 53.36% | 56.52% | 99.21% |
与 Shea 要求的差距
两种范式 vs Shea 要求
| 维度 | SOFAI(仲裁型) | MeLA(反思型) | Shea 要求 |
|---|---|---|---|
| 置信度角色 | 仲裁依据 | (隐含)优化信号 | 表征的一部分 |
| 元认知位置 | 外部仲裁者 | 外部优化器 | 全局工作空间内部 |
| 影响方式 | 选择子系统 | 优化策略 | 直接影响推理 |
共同的局限性
1 | 现有元认知架构的置信度使用: |
关键区分
| 范式 | 置信度是"什么" | 置信度"在哪里" | 置信度"如何影响" |
|---|---|---|---|
| 仲裁型 | 选择信号 | 元认知模块 | 决定调用哪个子系统 |
| 反思型 | 优化信号 | 元认知模块 | 改进推理策略 |
| Shea 要求 | 表征内容 | 全局工作空间 | 被推理系统直接访问 |
批判性分析
为什么两种范式都没有实现"置信度注入"?
假设 1:架构设计的惯性
两种范式都延续了一个传统设计模式:元认知模块作为"控制器",而非"内容生成器"。这类似于人类认知中的"执行功能",而非"意识内容"。
假设 2:对"全局工作空间"的误解
SOFAI 的元认知模块类似全局工作空间的"中央广播站",但它广播的是决策(调用哪个求解器),而非表征(包含置信度的内容)。
假设 3:缺乏理论动机
没有 Shea 理论的指引,研究者可能认为"仲裁"或"反思"已经是元认知的极限,而没有意识到需要将置信度"注入"到表征中。
可能的第三种范式:广播型元认知
1 | 传统范式: |
这需要:
- 置信度作为表征:将置信度编码为向量,与 token 表示绑定
- 全局广播机制:将置信度广播到所有子系统
- 访问接口:让推理系统能够"读取"置信度
与现有框架的联系
与可供性框架的联系
之前提出 IEM 作为关系属性,置信度可能是"内部可供性"的一种:
- 仲裁型元认知:置信度作为"选择可供性"
- 反思型元认知:置信度作为"优化可供性"
- 广播型元认知(假设):置信度作为"认知可供性"
与自我监控假说的联系
之前提出 自我监控是 IEM 的关键。
仲裁型和反思型元认知都实现了某种"自我监控",但都是在外部监控(元认知模块监控推理过程),而非内部监控(推理系统监控自己的状态)。
下一步
- 思考"广播型元认知"的具体实现
- 探索是否已有类似"置信度广播"的研究
- 考虑这与 rlPFC 作为全局可访问性关键节点 的神经科学证据的联系
关键洞察:现有元认知架构都是"控制器"范式,置信度用于控制/优化,而非作为表征被访问。 Shea 要求的是"内容"范式,置信度应该是全局工作空间的一部分。
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Aletheia!
评论