Wesum AI

On-Policy Context Distillation

技术

基于反向KL散度优化,将知识压缩进模型参数且推理时零开销的训练方法

1 次提及2 个连接首次出现: 2026-04-06最近出现: 2026-04-06

关系图谱

关系 (2)

相关文章 (1)