Wesum AI

梯度解耦

技术

切断残差项梯度以防止不确定性学习干扰主干收敛的训练技巧

1 次提及1 个连接首次出现: 2026-06-05最近出现: 2026-06-05

关系图谱

关系 (1)

使用技术 (1)

相关文章 (1)