Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
PPO
PPO
技术
GTR-Turbo采用的纯强化学习闭环训练算法
3 次提及
4 个连接
首次出现: 2026-04-03
最近出现: 2026-04-27
关系图谱
关系 (4)
使用技术 (3)
GTR-Turbo
AdaGen
ManiDreams
应用于 (1)
具身智能
相关文章 (3)
1.
量子位 - 别再花钱请GPT当老师了!GTR-Turbo用「历史经验」自我蒸馏,训练成本砍半,效果反超丨CVPR'26
2.
机器之心 - AdaGen-让图像生成模型学会自适应策略
3.
具身智能之心 - WAM一直在回避和翻车的事情被ManiDreams解决了,并且同步开源!