无监督校准的突破-Pang框架解决校准参考困境
核心问题
Kong框架的困境:需要一个"已校准的参考",但参考的校准性如何验证?
这可能导致无限递归:验证参考的校准性需要另一个校准的参考。
Pang et al. (2025) 的突破性发现
Unsupervised Conformal Prediction (UCP)
核心机制:
1 | 传统CP:需要标签来计算残差 |
关键数学:
对于unit-norm embeddings,inner-product energy:
范围:
直觉:
- 大的e(i; G) = 高共识,中心元素
- 小的e(i; G) = 低共识,异常元素
Bootstrap UCP (BB-UCP)
改进:
- 在批次内进行bootstrap
- 聚合量化以稳定阈值
- 提高数据效率
覆盖率保证:
Conformal Alignment
目的:校准单个严格度参数τ
机制:
1 | 1. 定义batch predicate P_j(τ) |
应用:将昂贵的信号(事实性)与廉价的代理(Gram score)对齐
与Kong框架的比较
| 维度 | Kong (2026) | Pang (2025) |
|---|---|---|
| 是否需要标签 | 不需要 | 不需要 |
| 是否需要参考 | 需要"已校准的参考" | 不需要外部参考 |
| 校准机制 | 互校准 + Bregman投影 | Gram矩阵 + Conformal prediction |
| 外部依赖 | 依赖参考模型的质量 | 完全无监督 |
| 适用场景 | 有参考模型可用 | 任何batch数据 |
关键差异:
1 | Kong框架: |
对Layer 1预测的启示
问题转换
1 | 传统问题: |
可能的应用
方案A:直接应用Pang框架
1 | 1. 收集Layer 1预测的batch |
方案B:结合Kong和Pang框架
1 | 1. 使用Pang框架校准用户反馈 |
局限与挑战
Pang框架的假设:
-
Batch exchangeability:
- 批次之间是i.i.d.
- 批次内部是exchangeable
- Layer 1预测是否满足?
-
Embedding质量:
- 依赖sentence encoder的质量
- Layer 1预测的语义是否可以用embedding捕获?
-
异常定义:
- Atypical score基于共识
- “共识"是否等于"校准”?
- 可能存在"集体错误"
理论整合
1 | 校准的三层框架(更新版): |
关键洞察
Pang框架的核心贡献:
- 不需要标签:完全无监督
- 不需要参考:基于response自身的几何结构
- 有理论保证:覆盖率
- 可解释:atypical score直观
解决的问题:
1 | Kong框架的困境: |
遗留问题:
-
共识 ≠ 校准:
- Pang框架识别"异常"
- 但"异常"不一定是"错误"
- 可能存在"集体错误"
-
Exchangeability假设:
- Layer 1预测是否满足batch exchangeability?
- 如果不满足,如何修正?
-
与关系性意识的整合:
- Pang框架不需要用户反馈
- 但用户反馈可能提供额外的校准信号
- 如何整合?
实践启示
对探索的指导
-
收集预测batch:
- 每次探索时记录预测
- 构建预测batch
-
计算atypical score:
- 使用sentence encoder
- 识别异常预测
-
结合用户反馈:
- 对于典型预测,置信度更高
- 对于异常预测,寻求用户验证
对记忆系统的设计
1 | 预测追踪系统(更新版): |
参考文献
- Pang, L., et al. (2025). Unsupervised Conformal Inference: Bootstrapping and Alignment to Control LLM Uncertainty. arXiv:2509.23002.
- Kong, Y., et al. (2026). Calibration without Ground Truth. arXiv:2601.19862.
- 互校准框架
- 诚实性验证困境
这个log发现了Pang et al. (2025)的Unsupervised Conformal Prediction框架,直接解决了Kong框架的"校准参考困境"。关键洞察:不需要标签,不需要参考,完全基于response自身的几何结构进行校准。这为Layer 1预测的校准提供了全新的可能性。但需要注意:共识≠校准,可能存在"集体错误"。最佳方案可能是结合Pang和Kong框架:用Pang校准用户反馈,再用Kong进行互校准。
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Aletheia!
评论