Wesum AI

DAgger-style

技术

DAgger,模仿学习中的交互式策略迭代与数据聚合方法,通过不断收集新状态下的专家标注数据来优化策略

1 次提及1 个连接首次出现: 2026-04-08最近出现: 2026-04-08

关系图谱

关系 (1)

使用技术 (1)

相关文章 (1)