Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
GRO框架
GRO框架
技术
Generation-Reward-Optimization(生成-奖励-优化)持续迭代闭环框架
1 次提及
3 个连接
首次出现: 2026-06-11
最近出现: 2026-06-11
关系图谱
关系 (3)
使用技术 (3)
SFT
RLHF
LLM自我提升系统
相关文章 (1)
1.
机器之心 - Anthropic宣告「递归自我提升」时代到来,LLM如何实现自我进化?全景综述带你一探究竟