Wesum AI

Flow-GRPO

技术

Flow-GRPO,基于 GRPO 算法扩展的在线强化学习训练方法,将策略梯度 RL 集成到流匹配和扩散模型中,主要用于提升文生图等生成任务的性能。

5 次提及7 个连接首次出现: 2026-04-23最近出现: 2026-06-11

关系图谱

关系 (7)

相关文章 (5)