Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
SSM+Attention混合架构
SSM+Attention混合架构
技术
将老信息压缩进快速权重以缓解内存压力的模型架构
2 次提及
3 个连接
首次出现: 2026-05-27
最近出现: 2026-05-28
关系图谱
关系 (3)
使用技术 (3)
Samba
Qwen3.5
KV Cache
相关文章 (2)
1.
量子位 - 大模型也需要睡觉!让AI打个盹,醒来更聪明
2.
硅星人Pro - 大模型也需要睡觉!让AI打个盹,醒来更聪明