Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
Flow-GRPO
Flow-GRPO
技术
Flow-GRPO,基于 GRPO 算法扩展的在线强化学习训练方法,将策略梯度 RL 集成到流匹配和扩散模型中,主要用于提升文生图等生成任务的性能。
5 次提及
7 个连接
首次出现: 2026-04-23
最近出现: 2026-06-11
关系图谱
关系 (7)
使用技术 (6)
GRPO
RL
SenseNova U1
World-R1
Agent
NEWTON
竞争 (1)
SOAR
相关文章 (5)
1.
量子位 - 视觉大模型迎来“o1时刻”:腾讯混元提出SOAR,让AI在生成中学会自我纠偏
2.
机器之心 - 商汤SenseNovaU1深度拆解,原生统一架构终结缝合时代
3.
量子位 - 解决视频生成穿帮问题!浙大&微软3000条纯文本让模型理解3D
4.
AI科技大本营 - 倒酒不涨液面、切木头没凹槽:NEWTON想治视频生成这些“荒诞细节”
5.
机器之心 - NEWTON-从「等物理涌现」到「请牛顿进工具箱」,Agent驱动的视频生成新范式