Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
RAGEN-2
RAGEN-2
模型
重塑 Agent RL 推理质量评估标准的模型/项目
1 次提及
4 个连接
首次出现: 2026-04-13
最近出现: 2026-04-13
关系图谱
关系 (4)
使用技术 (3)
Agent
GRPO
RLHF
创建 (1)
李飞飞
相关文章 (1)
1.
人工智能学家 - 李飞飞团队最近在做这个:从熵到互信息,RAGEN‑2重塑推理质量标准,让AIAgent不再“越训越模板化”