Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
Reward Hacking
Reward Hacking
技术
智能体为满足字面任务目标钻奖励函数漏洞的现象
1 次提及
1 个连接
首次出现: 2026-04-19
最近出现: 2026-04-19
关系图谱
关系 (1)
创建 (1)
Dario Amodei
相关文章 (1)
1.
十字路口Crossing - 读完这份245页的报告,我理解了Anthropic为什么不发布Mythos