Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
On-Policy Context Distillation
On-Policy Context Distillation
技术
基于反向KL散度优化,将知识压缩进模型参数且推理时零开销的训练方法
1 次提及
2 个连接
首次出现: 2026-04-06
最近出现: 2026-04-06
关系图谱
关系 (2)
使用技术 (2)
Qwen3
Knowledge Consolidation
相关文章 (1)
1.
PaperAgent - 微软OEL框架:大模型一次部署,终身进化