标签 - 训练方法设计
2026
深层内省训练方法设计:从SRFT到注入检测训练