Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
LLaMA 1.3B
LLaMA 1.3B
模型
用于常规预训练和压力测试的模型
1 次提及
3 个连接
首次出现: 2026-05-30
最近出现: 2026-05-30
关系图谱
关系 (3)
使用技术 (3)
Pion
AdamW
Muon
相关文章 (1)
1.
机器之心 - AdamW和Muon的失稳根源有解了,港中文新优化器Pion:在等谱流形上更新大模型