Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
RL
RL
技术
强化学习,通过环境反馈修正动作,引入闭环优化
9 次提及
14 个连接
首次出现: 2026-03-30
最近出现: 2026-04-23
关系图谱
关系 (15)
使用技术 (10)
宇树科技
GEN-1
RealtimeVLA V2
RealtimeVLA V2
AdaGen
ManipDojo双臂协作挑战赛
R-EMID
CoRL
Flow-GRPO
RLHF
应用于 (4)
自动驾驶
具身智能
机器人
AI写作
竞争 (1)
VLA
相关文章 (9)
1.
具身智能之心 - RL让VLA从“静态策略”进化为“可进化策略”.......
2.
AI科技评论 - 羊毛党大军,狂薅模型Token;明星AI公司,上市却现离职潮;华东大厂AI基建华南遇阻AI情报局VOL.2
3.
机器人前瞻 - 12秒折完一个纸箱,成功率99%,GeneralistAI最强具身模型发布了!
4.
具身智能之心 - VLA如何在机器人上变得更快?RealtimeVLAV2:机器人快速动起来时遇到的天坑
5.
AI科技大本营 - 原力灵机发布Realtime-VLAV2:从遥操作到真实部署,VLA提速的系统解法
6.
机器之心 - AdaGen-让图像生成模型学会自适应策略
7.
具身智能之心 - 无需本体,云端即可!ICRA’26双臂挑战赛ManipDojo来啦(重点关注VLA和RL)
8.
PaperWeekly - ACL2026通义首提R-EMID框架:形式化揭示角色扮演性能退化机制
9.
量子位 - 视觉大模型迎来“o1时刻”:腾讯混元提出SOAR,让AI在生成中学会自我纠偏