Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
GQA
GQA
技术
分组查询注意力机制
2 次提及
2 个连接
首次出现: 2026-05-19
最近出现: 2026-06-11
关系图谱
关系 (2)
使用技术 (2)
Gemma 4
Q-K=V
相关文章 (2)
1.
机器之心 - LLM近期重大架构进化一览:从Gemma4到DeepSeekV4
2.
PaperWeekly - Transformer非得凑齐QKV吗?只需共享KV,推理缓存直降50%