Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
RAGEN-2
RAGEN-2
模型
RAGEN-2,揭示Agent RL训练中Template Collapse等推理失效模式的研究,为评估和提升Agent推理质量提供新标准
1 次提及
4 个连接
首次出现: 2026-04-13
最近出现: 2026-04-13
关系图谱
关系 (4)
使用技术 (3)
Agent
GRPO
RLHF
创建 (1)
李飞飞
相关文章 (1)
1.
人工智能学家 - 李飞飞团队最近在做这个:从熵到互信息,RAGEN‑2重塑推理质量标准,让AIAgent不再“越训越模板化”