Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
Self-Taught RLVR
Self-Taught RLVR
技术
京东&中科院信工所提出的统一命题框架,让大模型以不同形态的自己为教师生成学习信号
1 次提及
5 个连接
首次出现: 2026-05-19
最近出现: 2026-05-19
关系图谱
关系 (5)
使用技术 (3)
RLSD
NPO
CoPD
发布 (2)
京东
中科院信工所
相关文章 (1)
1.
量子位 - 让大模型学会「自己教自己」!京东&中科院信工所连发三篇论文定义Self-TaughtRLVR