Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
MSRL
MSRL
技术
多阶段RL框架,通过文本偏好数据训练并迁移至多模态任务的奖励模型
1 次提及
4 个连接
首次出现: 2026-04-30
最近出现: 2026-04-30
关系图谱
关系 (4)
应用于 (4)
图像生成
视频生成
多模态理解
CVPR 2026
相关文章 (1)
1.
PaperAgent - 越来越觉得强化学习是未来!CVPR-ICML-ICLR-等8大顶会2026最新RL论文整理