Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
On-Policy Token-Level 蒸馏
On-Policy Token-Level 蒸馏
技术
学生模型在自身生成轨迹上获得教师纠正信号的训练机制
1 次提及
2 个连接
首次出现: 2026-05-19
最近出现: 2026-05-19
关系图谱
关系 (2)
使用技术 (1)
ProteinOPD
应用于 (1)
蛋白质设计
相关文章 (1)
1.
ScienceAI - 清华大学发布ProteinOPD:面向蛋白质设计的高效多目标偏好对齐框架