Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
自然语言自动编码器
自然语言自动编码器
技术
将模型激活值翻译为人类可读文本的技术
2 次提及
8 个连接
首次出现: 2026-05-08
最近出现: 2026-05-15
关系图谱
关系 (8)
使用技术 (4)
GRPO
Gemma-3-27B
Claude Opus 4.6
Supervised Fine-Tuning
应用于 (2)
AI安全
可解释AI
发布 (1)
Anthropic
使用 (1)
Claude Sonnet 4.6
相关文章 (2)
1.
智东西 - 撬开大模型黑箱!Anthropic新研究把AI思考过程公开了,隐藏动机发现率涨了4倍
2.
InfoQ - Anthropic最新论文撬开大模型黑箱:隐藏动机发现率提升4倍以上