Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
TPMA-GRPO
TPMA-GRPO
技术
引入前缀门控和位置感知边际贡献分配的偏好对齐强化学习技术
1 次提及
2 个连接
首次出现: 2026-05-13
最近出现: 2026-05-13
关系图谱
关系 (2)
使用技术 (1)
OneSearch-V2
应用于 (1)
AI搜索
相关文章 (1)
1.
机器之心 - 0成本升级,快手OneSearch-V2全量上线,生成式搜索进入「懂你」时代