Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
LAPO
LAPO
技术
联合优化算法,将环境奖励同时作用于latent reasoning和action generation
3 次提及
1 个连接
首次出现: 2026-05-11
最近出现: 2026-05-21
关系图谱
关系 (1)
使用技术 (1)
LaST-R1
相关文章 (3)
1.
量子位 - 具身大模型R1时刻:LIBERO终结者,99.9%背后的物理推理新范式
2.
新智元 - 机器人模型R1时刻!不只学动作更学会物理推理,LIBERO99.9%
3.
具身智能之心 - 重磅分享!LaST-R1:让RL激活机器人的物理世界!达到接近99.9%的成功率