Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
RPGBench
RPGBench
模型
包含17k样本,用于评估三类分布偏移下模型表现的角色扮演基准测试
1 次提及
1 个连接
首次出现: 2026-04-17
最近出现: 2026-04-17
关系图谱
关系 (1)
发布 (1)
阿里巴巴
相关文章 (1)
1.
PaperWeekly - ACL2026通义首提R-EMID框架:形式化揭示角色扮演性能退化机制