Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
OSCAR
OSCAR
技术
一种基于 attention-aware 旋转策略的真 2-bit KV 量化算法
3 次提及
11 个连接
首次出现: 2026-05-26
最近出现: 2026-06-02
关系图谱
关系 (12)
使用技术 (6)
Qwen3
GLM-5
KV Cache
Attention Mechanism
GLM-4
SGLang
应用于 (2)
KV Cache
代码生成
使用 (2)
Qwen3-4B-Thinking
GLM-4.7-FP8
竞争 (1)
TurboQuant
发布 (1)
TogetherAI
相关文章 (3)
1.
CVer - 超越TurboQuant内存有救了!OSCAR:真2-bitKV量化算法
2.
PaperWeekly - 超越TurboQuant!KVCache压到真2-bit,长上下文推理又快又稳
3.
AI科技大本营 - 真正的2-bitKVCache来了,OSCAR做到了一件很多人认为不可能的事