Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
Muon
Muon
技术
Muon,基于 Newton-Schulz 近似极分解的二阶神经网络优化器,适用于大语言模型隐藏层的大批量参数训练
5 次提及
8 个连接
首次出现: 2026-03-31
最近出现: 2026-05-30
关系图谱
关系 (9)
使用技术 (6)
Kimi Moonshot
DeepSeek V3
DeepSeek V4
月之暗面
Kimi K2
LLaMA 1.3B
应用于 (3)
Kimi Moonshot
LLaMA 3
突破
相关文章 (5)
1.
机器之心 - 不加算力,只改一个算法:Muon在万亿MoE模型中最高2倍加速
2.
Kimi智能助手 - Kimi杨植麟「GTC2026」演讲全文(附视频)
3.
AI范儿 - DeepSeekV4背后,竟然藏着一个月之暗面的影子
4.
硅星人Pro - 知春路最有AGI理想的两个男人
5.
机器之心 - AdamW和Muon的失稳根源有解了,港中文新优化器Pion:在等谱流形上更新大模型