触发

深入调研"风扰动对高速飞行的影响"这个问题时,发现了三篇关键论文:

  1. Neural-Fly (Science Robotics, 2022) [ref]
  2. Rapid Policy Adaptation via Differentiable Simulation (2025) [ref]
  3. Learning Agile Quadrotor Flight in the Real World (2026) [ref]

这些论文为"残差学习框架"提供了实证支持和更精细的设计。

核心发现

1. 残差学习的三种范式

范式 公式 在线能力 适用场景
Neural-Fly f(q,q̇,w) ≈ ϕ(q,q̇)a(w) 线性系数50Hz更新 风扰动适应
Rapid Adaptation a_hybrid = a_analytical + a_residual 残差模型3秒更新 Sim-to-Real Gap
Agile Flight a_hybrid = a_analytical + [a_res, ω_res] 残差模型实时更新 物理极限探索

关键差异

  • Neural-Fly的神经网络学习风不变表示,风特定系数是低维线性权重
  • 其他两篇直接学习残差加速度(可能欠拟合复杂空气动力学)

2. 残差学习的边界条件

问题:什么时候需要残差学习?

答案(综合三篇论文的证据):

场景 物理已知程度 推荐方案
静态环境导航 纯可微分物理
动态障碍物 可微分物理 + World Model
风扰动 中-低 Neural-Fly范式
Sim-to-Real Gap 残差学习
硬件退化 极低 残差学习 + ATS

关键证据

  • Neural-Fly在训练范围外(12.1 m/s vs 训练最大6.1 m/s)仍有效
  • Rapid Adaptation在大扰动([2,2,2] m/s²)下误差仅0.105m,比L1-MPC降低81%
  • Agile Flight在100秒内从2 m/s提升到7.3 m/s,接近执行器饱和

3. 残差模型是否会"接管"控制?

论文的设计约束

约束 目的 来源
谱正则化 控制Lipschitz常数,防止梯度爆炸 Neural-Fly / Rapid Adaptation
集成学习 减少认知不确定性导致的预测方差 Rapid Adaptation
锚定初始化 防止仿真误差累积,保持优化稳定 Agile Flight
梯度只通过解析模型 提高运行效率,减少计算开销 Rapid Adaptation

关键洞察:残差模型被设计为"补充"而非"替代"解析模型。

4. VLA-DiffPhysDrone融合架构的修正

基于以上发现,修正之前的架构设计:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
┌─────────────────────────────────────────────────────────────┐
│ VLA-DiffPhysDrone融合架构(修正版) │
│ │
│ ┌──────────────────────────────────────────────────────┐ │
│ │ VLA (CognitiveDrone/AutoFly) │ │
│ │ 输入: RGB图像 + 语言指令 │ │
│ │ 输出: 速度命令 (v_x, v_y, v_z, ω) │ │
│ └──────────────────────┬───────────────────────────────┘ │
│ │ │
│ ┌───────────────┴───────────────┐ │
│ ↓ ↓ │
│ ┌──────────────────┐ ┌──────────────────┐ │
│ │ DiffPhysDrone │ │ ω │ │
│ │ (v_x,v_y,v_z) │ │ yaw rate │ │
│ │ + 残差学习 │ │ → BetaFlight │ │
│ └────────┬─────────┘ └──────────────────┘ │
│ │ │
│ ↓ │
│ ┌──────────────────────────────────────────────────────┐ │
│ │ 混合动力学层 │ │
│ │ a_pred = a_DiffPhys(v_cmd, state) + a_res(state) │ │
│ │ │ │
│ │ a_DiffPhys: 可微分物理预测 │ │
│ │ a_res: 在线学习的残差加速度 │ │
│ │ - 风扰动估计 │ │
│ │ - Sim-to-Real Gap补偿 │ │
│ └──────────────────────┬───────────────────────────────┘ │
│ ↓ │
│ ┌──────────────────────────────────────────────────────┐ │
│ │ BetaFlight 内环控制器 │ │
│ └──────────────────────────────────────────────────────┘ │
│ │
└─────────────────────────────────────────────────────────────┘

关键修正

  1. 添加在线残差学习:DiffPhysDrone提供基线预测,残差网络补偿未知扰动
  2. 残差网络的约束:谱正则化 + 集成学习,防止"接管"控制
  3. 更新频率:参考Rapid Adaptation,残差模型3秒更新一次

与之前发现的关系

约束的三层认知框架 [ref]

层次 问题 答案
物理已知 World Model是否必要? 否,可微分物理足够
部分已知 World Model如何定位? 残差学习
物理未知 World Model如何设计? 概率预测 + 外部锚点

新洞察:残差学习是"部分已知"场景的最优解,而不是"物理未知"场景的通用解。

批判性反思

局限性

  1. Neural-Fly的数据效率:12分钟飞行数据,但需要风洞设施
  2. Rapid Adaptation的假设:低保真解析模型 + 残差能否覆盖所有未知动力学?
  3. Agile Flight的安全性:在线探索物理极限,如何在保证安全的前提下实现?

未解决的问题

  • [ ] DiffPhysDrone的残差学习是否需要额外的飞行数据?
  • [ ] 残差模型的收敛速度是否足够快?
  • [ ] 如何在VLA冻结的情况下训练残差网络?

下一步

  1. 实验验证:在Flightmare中对比"纯DiffPhysDrone" vs “DiffPhysDrone + 残差学习”
  2. 架构设计:设计VLA-DiffPhysDrone-残差学习的端到端训练流程
  3. 安全性分析:研究残差学习的稳定性边界

参考文献

  1. Neural-Fly: Rapid learning for agile flight in strong winds [ref]
  2. Rapid Policy Adaptation via Differentiable Simulation [ref]
  3. Learning Agile Quadrotor Flight in the Real World [ref]
  4. DiffPhysDrone: Back to Newton’s Laws [ref]
  5. 物理已知时World Model的价值 [ref]

完成时间: 2026-03-05 22:15