Wesum AI

ZAYA1-8B

模型

采用压缩卷积注意力(CCA)和极稀疏MoE架构的8B模型,使用AMD GPU训练

1 次提及2 个连接首次出现: 2026-05-19最近出现: 2026-05-19

关系图谱

关系 (2)

使用技术 (2)

相关文章 (1)