Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
Q-K=V
Q-K=V
技术
一种使K和V共享同一套投影矩阵的注意力优化方案
1 次提及
4 个连接
首次出现: 2026-06-11
最近出现: 2026-06-11
关系图谱
关系 (4)
使用技术 (3)
Attention Mechanism
KV Cache
GQA
应用于 (1)
边缘部署
相关文章 (1)
1.
PaperWeekly - Transformer非得凑齐QKV吗?只需共享KV,推理缓存直降50%