Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
Benchmark
Benchmark
技术
用于持续测试和评估Agent执行过程的数据集
1 次提及
1 个连接
首次出现: 2026-05-21
最近出现: 2026-06-22
关系图谱
关系 (1)
应用于 (1)
具身智能
相关文章 (1)
1.
AI科技大本营 - “超级Agent”大梦初醒:任务一长就“飘”、动辄陷入“无限探索”?一场对话复盘工业级智能体的真实痛点与终局AI进化论