Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
ZAYA1-8B
ZAYA1-8B
模型
采用压缩卷积注意力(CCA)和极稀疏MoE架构的8B模型,使用AMD GPU训练
1 次提及
2 个连接
首次出现: 2026-05-19
最近出现: 2026-05-19
关系图谱
关系 (2)
使用技术 (2)
CCA
MoE
相关文章 (1)
1.
机器之心 - LLM近期重大架构进化一览:从Gemma4到DeepSeekV4