Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
异步强化学习
异步强化学习
技术
将策略采样与参数更新解耦的强化学习训练架构
1 次提及
1 个连接
首次出现: 2026-05-18
最近出现: 2026-05-18
关系图谱
关系 (1)
使用技术 (1)
Ring-2.6-1T
相关文章 (1)
1.
AI前线 - 兼顾效率、成本与能力,百灵开源旗舰推理模型Ring-2.6-1T