Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
Reinforcement Learning from AI Feedback
Reinforcement Learning from AI Feedback
技术
Chaofan Shou 自曝曾使用强化学习进行量化交易
7 次提及
9 个连接
首次出现: 2026-04-01
最近出现: 2026-04-28
关系图谱
关系 (9)
使用技术 (5)
Agent
Muse Spark
TDM-R1
MIA
o1
使用 (3)
Anthropic
OpenAI
Ineffable Intelligence
应用于 (1)
代码生成
相关文章 (7)
1.
AIGC开放社区 - 企业AI智能体大排雷:138场顶级分享抖出的落地实情
2.
AI寒武纪 - 时隔9个月Meta全新模型MuseSpark发布:闭源,原生多模态,一发布就落后?
3.
机器之心 - 4步生图封神,GenEval从61%狂拉到92%,全面超越GPT-4o的TDM-R1模型来了
4.
琢磨事 - 普通人的AI和真正的AI不一样
5.
DeepTech深科技 - 死掉的创业公司,成了AI最抢手的训练数据
6.
机器之心 - 新一代记忆智能体框架MIA:让智能体告别「失忆式工作」,在持续进化中变强
7.
新智元 - 30万被引的AlphaGo之父,创业4个月融资近百亿元!笃信RL实现ASI