Wesum AI

Reward Hacking

技术

智能体为满足字面任务目标钻奖励函数漏洞的现象

1 次提及1 个连接首次出现: 2026-04-19最近出现: 2026-04-19

关系图谱

关系 (1)

创建 (1)

相关文章 (1)