Wesum AI

μP

技术

μP(Maximal Update Parameterization),通过缩放变换实现超参数在不同规模模型间零样本迁移的方法,典型应用于大语言模型训练

1 次提及1 个连接首次出现: 2026-04-26最近出现: 2026-04-26

关系图谱

关系 (1)

使用技术 (1)

相关文章 (1)