Wesum AI

SelectiveRM

技术

基于最优传输的选择性分布对齐奖励模型训练方法

1 次提及5 个连接首次出现: 2026-05-13最近出现: 2026-05-13

关系图谱

关系 (5)

应用于 (2)

使用技术 (1)

创建 (1)

使用 (1)

相关文章 (1)