Wesum AI

reverse-KL

技术

Reverse KL,一种具有mode-seeking特性的KL散度变体,常用于RLHF和DPO等大模型对齐训练

1 次提及1 个连接首次出现: 2026-04-09最近出现: 2026-04-09

关系图谱

关系 (1)

使用技术 (1)

相关文章 (1)