Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
ADeLe
ADeLe
技术
大模型评估新框架,基于IRT将评估升级为能力画像,实现约88%的跨任务预测准确率
1 次提及
2 个连接
首次出现: 2026-04-02
最近出现: 2026-04-02
关系图谱
关系 (2)
使用技术 (1)
GPT
应用于 (1)
基准测试
相关文章 (1)
1.
PaperWeekly - 00后国人一作再发Nature:大模型新任务表现如何,现在能精准预测了