Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
Reinforcement Learning
Reinforcement Learning
技术
Reinforcement Learning,强化学习,让智能体通过与环境交互的试错机制学习最优策略,应用于机器人控制、游戏博弈和推荐系统等场景
8 次提及
12 个连接
首次出现: 2026-04-09
最近出现: 2026-06-29
关系图谱
关系 (12)
使用技术 (8)
GPT-4o
AlphaFold
AlphaGo
Meta
MetaCode
MusaCoder-27B
SyntheMol-RL
DeepSeek R1
应用于 (4)
3D生成
数据标注
代码生成
具身智能
相关文章 (8)
1.
AI有道 - 完球了,GPT-4o之母宣布离职OpenAI
2.
机器之心 - ICLR发了Oral又反悔,理由是查到了制裁名单?
3.
人工智能学家 - 诺贝尔奖得主哈萨比斯爆料,虚拟细胞和超级智能的时代即将来临!并亲授逆袭科技巨头的AI创业秘籍
4.
机器之心 - 员工骂高管、限token使用量、扎克伯格承认犯错:Meta内部炸锅了
5.
机器之心 - 用国产GPU训练AI给自己写内核,摩尔线程刷榜硬核基准
6.
ScienceAI - Nature丨从10,747个分子到460亿个候选:AI正在把抗生素研发改写成一门可计算的实验科学
7.
甲子光年 - 经纬领投2000万美元,AetherAI让机器人学会举一反三|甲子光年
8.
InfoQ - 2026AICon上海站收官:模型热“退烧”,场景战“开打”,AI公司得学会自己“挣钱养家”