Wesum AI

Cross-Layer Attention

技术

跨层注意力机制,后续层直接复用前面同类型层的KV Tensor

1 次提及1 个连接首次出现: 2026-05-19最近出现: 2026-05-19

关系图谱

关系 (1)

使用技术 (1)

相关文章 (1)