Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
MathForge
MathForge
模型
MathForge,基于难题驱动强化学习的训练框架,用于提升大模型的数学推理能力(含 DGPO 和 MQR 方法)
1 次提及
2 个连接
最近出现: 2026-04-26
关系图谱
关系 (2)
使用技术 (1)
GRPO
应用于 (1)
多模态理解
相关文章 (1)
1.
机器之心 - ICLR2026|MathForge:用难题驱动强化学习,提升大模型数学推理