Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
G²RPO-A
G²RPO-A
技术
通过注入高质量思维轨迹与自适应调整指导强度的新算法
1 次提及
3 个连接
首次出现: 2026-05-06
最近出现: 2026-05-06
关系图谱
关系 (3)
应用于 (2)
代码生成
数学
使用技术 (1)
Qwen3-1.7B
相关文章 (1)
1.
机器之心 - GRPO遭遇瓶颈?G²RPO-A让自适应指导为小模型推理能力「开外挂」