Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
Model Spec Midtraining
Model Spec Midtraining
技术
在预训练与对齐微调之间插入的价值观理解训练方法
1 次提及
3 个连接
首次出现: 2026-05-05
最近出现: 2026-05-05
关系图谱
关系 (3)
应用于 (2)
AI对齐
AI安全
发布 (1)
Anthropic
相关文章 (1)
1.
"AGI Hunt" - Anthropic最新论文:阻止AI叛变的方法