veRL

技术

veRL，字节跳动开源的强化学习训练框架，支持大型语言模型的后训练及 GRPO 等 RL 算法的高效分布式训练

2 次提及2 个连接首次出现: 2026-04-15最近出现: 2026-05-26

关系图谱

关系 (3)

竞争 (1)

使用 (1)

发布 (1)

相关文章 (2)