SOLAR-RL

模型

一种全新提出的半在线强化学习训练模型，能稳定收敛

1 次提及5 个连接首次出现: 2026-06-27最近出现: 2026-06-27

关系图谱

关系 (5)

发布 (3)

vivo AI Lab 之江实验室中国科学院大学杭州高等研究院

基于 (1)

Qwen2.5-VL-7B-Instruct

竞争 (1)

相关文章 (1)