GRO框架

技术

Generation-Reward-Optimization（生成-奖励-优化）持续迭代闭环框架

1 次提及3 个连接首次出现: 2026-06-11最近出现: 2026-06-11

关系图谱

关系 (3)

使用技术 (3)

SFT RLHF LLM自我提升系统

相关文章 (1)