Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
可微VQA reward
可微VQA reward
技术
将VLM对Yes的概率转化为可用于反向传播更新LoRA的监督信号
1 次提及
1 个连接
首次出现: 2026-06-07
最近出现: 2026-06-07
关系图谱
关系 (1)
使用技术 (1)
VLM-as-Teacher
相关文章 (1)
1.
量子位 - 快手可灵提出VLM-as-Teacher:用测试时在线优化,让视频生成模型学会按规则推理