Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
稀疏注意力
稀疏注意力
技术
HISA针对并改进的token级注意力机制,旨在解决索引瓶颈
1 次提及
3 个连接
首次出现: 2026-04-06
最近出现: 2026-04-06
关系图谱
关系 (3)
使用技术 (2)
DeepSeek V3
GLM-5
应用于 (1)
长文本理解
相关文章 (1)
1.
CVer - 北大团队改造DeepSeek注意力,速度快四倍还不丢精度!