Flow-GRPO

技术

Flow-GRPO，基于 GRPO 算法扩展的在线强化学习训练方法，将策略梯度 RL 集成到流匹配和扩散模型中，主要用于提升文生图等生成任务的性能。

5 次提及7 个连接首次出现: 2026-04-23最近出现: 2026-06-11

关系图谱

关系 (7)

使用技术 (6)

GRPO RL SenseNova U1 World-R1 Agent NEWTON

竞争 (1)

相关文章 (5)