Wesum AI

Muon

技术

Muon,基于 Newton-Schulz 近似极分解的二阶神经网络优化器,适用于大语言模型隐藏层的大批量参数训练

5 次提及8 个连接首次出现: 2026-03-31最近出现: 2026-05-30

关系图谱

关系 (9)

相关文章 (5)