Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
ROMI
ROMI
模型
提出的一种鲁棒价值感知的模型学习框架
1 次提及
8 个连接
首次出现: 2026-06-24
最近出现: 2026-06-24
关系图谱
关系 (8)
发布 (3)
香港城市大学
腾讯
芝加哥大学
使用技术 (2)
双层优化
Wasserstein 距离
竞争 (1)
RAMBO
应用于 (1)
离线强化学习
使用 (1)
SAC
相关文章 (1)
1.
AI科技评论 - GAIRPaper105|离线强化学习新突破——ROMI:破解对抗式模型学习「过保守、训不稳」深层困局|ICLR2026