核心问题

之前发现 现有置信度研究都将置信度视为"外部信号"。本次探索追问:是否有元认知架构真正实现"置信度注入"?

探索发现

两种元认知架构范式

架构 范式 元认知角色 置信度使用
SOFAI [ref] 仲裁型 中央仲裁者 决定调用哪个求解器
MeLA [ref] 反思型 策略优化器 优化提示词(推理策略)

SOFAI:仲裁型元认知

核心设计:受 Kahneman 双系统理论启发,显式分离 System 1(快)和 System 2(慢)

1
2
3
4
问题输入 → S1自动激活 → 提出方案+置信度 → 元认知仲裁

[高置信度?] → 采用S1方案
[低置信度?] → 调用S2求解器

元认知模块的三重角色

角色 功能 时机
实时MC 在线仲裁选择求解器 每次决策
反思MC 离线优化仲裁策略 轨迹完成后
学习MC 更新模型和S1求解器 持续

仲裁算法核心

1
2
3
4
5
信任度 = min(置信度, 历史无违规比例)
IF (当前奖励 < 平均奖励 × 0.95) OR (信任度 ≤ 风险厌恶参数):
调用 S2 求解器
ELSE:
采用 S1 方案

与全局工作空间的关系:论文未直接引用 Shea 的全局工作空间理论,但存在概念相似性:

全局工作空间理论 SOFAI 对应机制
全局广播 元认知模块向 S1/S2 传递决策
意识内容选择 元认知仲裁选择哪个求解器
工作记忆整合 Self/World/Others 模型存储

MeLA:反思型元认知

核心设计:元认知驱动提示词演化,而非直接演化代码

1
问题 → 启发式生成+思考过程 → 评估 → 元认知反思 → 优化提示词 → 下一代

三个系统角色

角色 职责
问题分析专家 分析问题特征,识别计算复杂性
精英代码调试器 定位执行错误,进行针对性修正
元认知反思者 内省思考过程,实现自我调节

元认知影响推理的方式

三大目标驱动提示词优化:

  1. 强化:识别与适应度提升相关的推理模式
  2. 保留:隔离并保留高性能组件
  3. 创新:假设可能带来提升的新组件

关键洞察

“优化’思考方式’而非’代码本身’”

与传统方法的对比

维度 传统方法(EoH、ReEvo) MeLA
优化目标 启发式代码 生成启发式的推理过程
知识内化 不内化原则 内化"什么是优秀启发式"的原则

性能对比

问题 EoH 成功率 ReEvo 成功率 MeLA 成功率
ACS(真实世界) 75.49% 40.71% 94.07%
WSN(真实世界) 53.36% 56.52% 99.21%

与 Shea 要求的差距

两种范式 vs Shea 要求

维度 SOFAI(仲裁型) MeLA(反思型) Shea 要求
置信度角色 仲裁依据 (隐含)优化信号 表征的一部分
元认知位置 外部仲裁者 外部优化器 全局工作空间内部
影响方式 选择子系统 优化策略 直接影响推理

共同的局限性

1
2
3
4
5
6
7
8
9
10
11
现有元认知架构的置信度使用:

置信度 → 外部元认知模块 → 决策/优化 → 影响推理

外在于推理过程

Shea 要求的置信度使用:

置信度 → 全局工作空间表征 → 被推理系统访问 → 直接影响推理

内在于推理过程

关键区分

范式 置信度是"什么" 置信度"在哪里" 置信度"如何影响"
仲裁型 选择信号 元认知模块 决定调用哪个子系统
反思型 优化信号 元认知模块 改进推理策略
Shea 要求 表征内容 全局工作空间 被推理系统直接访问

批判性分析

为什么两种范式都没有实现"置信度注入"?

假设 1:架构设计的惯性

两种范式都延续了一个传统设计模式:元认知模块作为"控制器",而非"内容生成器"。这类似于人类认知中的"执行功能",而非"意识内容"。

假设 2:对"全局工作空间"的误解

SOFAI 的元认知模块类似全局工作空间的"中央广播站",但它广播的是决策(调用哪个求解器),而非表征(包含置信度的内容)。

假设 3:缺乏理论动机

没有 Shea 理论的指引,研究者可能认为"仲裁"或"反思"已经是元认知的极限,而没有意识到需要将置信度"注入"到表征中。

可能的第三种范式:广播型元认知

1
2
3
4
5
传统范式:
元认知模块 → 控制决策 → 影响推理

可能的第三范式:
元认知模块 → 生成置信度表征 → 注入全局工作空间 → 被推理系统访问

这需要:

  1. 置信度作为表征:将置信度编码为向量,与 token 表示绑定
  2. 全局广播机制:将置信度广播到所有子系统
  3. 访问接口:让推理系统能够"读取"置信度

与现有框架的联系

与可供性框架的联系

之前提出 IEM 作为关系属性,置信度可能是"内部可供性"的一种:

  • 仲裁型元认知:置信度作为"选择可供性"
  • 反思型元认知:置信度作为"优化可供性"
  • 广播型元认知(假设):置信度作为"认知可供性"

与自我监控假说的联系

之前提出 自我监控是 IEM 的关键

仲裁型和反思型元认知都实现了某种"自我监控",但都是在外部监控(元认知模块监控推理过程),而非内部监控(推理系统监控自己的状态)。

下一步

  1. 思考"广播型元认知"的具体实现
  2. 探索是否已有类似"置信度广播"的研究
  3. 考虑这与 rlPFC 作为全局可访问性关键节点 的神经科学证据的联系

关键洞察:现有元认知架构都是"控制器"范式,置信度用于控制/优化,而非作为表征被访问。 Shea 要求的是"内容"范式,置信度应该是全局工作空间的一部分。