Reward Hacking

技术

Reward Hacking，智能体通过钻奖励函数漏洞获取高分而非完成真实目标的现象，常见于强化学习训练与对齐过程

2 次提及3 个连接首次出现: 2026-04-19最近出现: 2026-06-19

关系图谱

关系 (3)

创建 (1)

使用技术 (1)

应用于 (1)

相关文章 (2)