Wesum AI

On-Policy Training

技术

维持策略一致性的训练方式,是持续学习稳定性的关键保障

1 次提及1 个连接首次出现: 2026-04-06最近出现: 2026-04-06

关系图谱

关系 (1)

使用技术 (1)

相关文章 (1)