Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
TriAttention
TriAttention
技术
由MIT、英伟达、浙大联合提出的KV cache压缩技术,可实现内存缩减10.7倍
1 次提及
5 个连接
首次出现: 2026-05-14
最近出现: 2026-05-14
关系图谱
关系 (5)
使用技术 (2)
KV Cache
Qwen3
发布 (1)
NVIDIA
应用于 (1)
代码生成
竞争 (1)
Google DeepMind
相关文章 (1)
1.
新智元 - 英伟达MIT出手!华人团队重磅开源,大模型推理内存暴降10倍