Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
distributional value learning
distributional value learning
技术
分布式价值学习,将标量价值信号建模为分布以缓解稀疏奖励问题
1 次提及
1 个连接
首次出现: 2026-05-30
最近出现: 2026-05-30
关系图谱
关系 (1)
使用技术 (1)
LWD
相关文章 (1)
1.
InfoQ - 对话罗剑岚:把机器人“部署”本身变成训练的一部分