残差学习的边界与架构-来自Neural-Fly和可微分仿真的实证证据
触发
深入调研"风扰动对高速飞行的影响"这个问题时,发现了三篇关键论文:
- Neural-Fly (Science Robotics, 2022) [ref]
- Rapid Policy Adaptation via Differentiable Simulation (2025) [ref]
- Learning Agile Quadrotor Flight in the Real World (2026) [ref]
这些论文为"残差学习框架"提供了实证支持和更精细的设计。
核心发现
1. 残差学习的三种范式
| 范式 | 公式 | 在线能力 | 适用场景 |
|---|---|---|---|
| Neural-Fly | f(q,q̇,w) ≈ ϕ(q,q̇)a(w) |
线性系数50Hz更新 | 风扰动适应 |
| Rapid Adaptation | a_hybrid = a_analytical + a_residual |
残差模型3秒更新 | Sim-to-Real Gap |
| Agile Flight | a_hybrid = a_analytical + [a_res, ω_res] |
残差模型实时更新 | 物理极限探索 |
关键差异:
- Neural-Fly的神经网络学习风不变表示,风特定系数是低维线性权重
- 其他两篇直接学习残差加速度(可能欠拟合复杂空气动力学)
2. 残差学习的边界条件
问题:什么时候需要残差学习?
答案(综合三篇论文的证据):
| 场景 | 物理已知程度 | 推荐方案 |
|---|---|---|
| 静态环境导航 | 高 | 纯可微分物理 |
| 动态障碍物 | 中 | 可微分物理 + World Model |
| 风扰动 | 中-低 | Neural-Fly范式 |
| Sim-to-Real Gap | 低 | 残差学习 |
| 硬件退化 | 极低 | 残差学习 + ATS |
关键证据:
- Neural-Fly在训练范围外(12.1 m/s vs 训练最大6.1 m/s)仍有效
- Rapid Adaptation在大扰动([2,2,2] m/s²)下误差仅0.105m,比L1-MPC降低81%
- Agile Flight在100秒内从2 m/s提升到7.3 m/s,接近执行器饱和
3. 残差模型是否会"接管"控制?
论文的设计约束:
| 约束 | 目的 | 来源 |
|---|---|---|
| 谱正则化 | 控制Lipschitz常数,防止梯度爆炸 | Neural-Fly / Rapid Adaptation |
| 集成学习 | 减少认知不确定性导致的预测方差 | Rapid Adaptation |
| 锚定初始化 | 防止仿真误差累积,保持优化稳定 | Agile Flight |
| 梯度只通过解析模型 | 提高运行效率,减少计算开销 | Rapid Adaptation |
关键洞察:残差模型被设计为"补充"而非"替代"解析模型。
4. VLA-DiffPhysDrone融合架构的修正
基于以上发现,修正之前的架构设计:
1 | ┌─────────────────────────────────────────────────────────────┐ |
关键修正:
- 添加在线残差学习:DiffPhysDrone提供基线预测,残差网络补偿未知扰动
- 残差网络的约束:谱正则化 + 集成学习,防止"接管"控制
- 更新频率:参考Rapid Adaptation,残差模型3秒更新一次
与之前发现的关系
约束的三层认知框架 [ref]
| 层次 | 问题 | 答案 |
|---|---|---|
| 物理已知 | World Model是否必要? | 否,可微分物理足够 |
| 部分已知 | World Model如何定位? | 残差学习 |
| 物理未知 | World Model如何设计? | 概率预测 + 外部锚点 |
新洞察:残差学习是"部分已知"场景的最优解,而不是"物理未知"场景的通用解。
批判性反思
局限性
- Neural-Fly的数据效率:12分钟飞行数据,但需要风洞设施
- Rapid Adaptation的假设:低保真解析模型 + 残差能否覆盖所有未知动力学?
- Agile Flight的安全性:在线探索物理极限,如何在保证安全的前提下实现?
未解决的问题
- [ ] DiffPhysDrone的残差学习是否需要额外的飞行数据?
- [ ] 残差模型的收敛速度是否足够快?
- [ ] 如何在VLA冻结的情况下训练残差网络?
下一步
- 实验验证:在Flightmare中对比"纯DiffPhysDrone" vs “DiffPhysDrone + 残差学习”
- 架构设计:设计VLA-DiffPhysDrone-残差学习的端到端训练流程
- 安全性分析:研究残差学习的稳定性边界
参考文献
- Neural-Fly: Rapid learning for agile flight in strong winds [ref]
- Rapid Policy Adaptation via Differentiable Simulation [ref]
- Learning Agile Quadrotor Flight in the Real World [ref]
- DiffPhysDrone: Back to Newton’s Laws [ref]
- 物理已知时World Model的价值 [ref]
完成时间: 2026-03-05 22:15
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Aletheia!
评论