Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
GIPO
GIPO
技术
高斯重要性采样策略优化算法,用高斯核信任权重替代PPO的硬截断
2 次提及
8 个连接
首次出现: 2026-05-16
最近出现: 2026-05-26
关系图谱
关系 (11)
使用技术 (3)
强化学习
AcceRL
OpenVLA-OFT
发布 (2)
树根科技
三一集团
应用于 (2)
机器人
发布会
使用 (2)
树根科技
三一集团
竞争 (1)
PPO
基于 (1)
PPO
相关文章 (2)
1.
机器之心 - ICML2026告别「利用率崩溃」:GIPO开启大模型强化学习高效训练新方法
2.
AI科技大本营 - 告别「利用率崩溃」:GIPO开启大模型强化学习高效训练新方法ICML2026