Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
强化学习
强化学习
技术
目标驱动的强化学习,用于优化目标函数并权衡收益与代价
51 次提及
47 个连接
首次出现: 2026-03-31
最近出现: 2026-04-29
关系图谱
关系 (49)
使用技术 (29)
DVDF
GLM-5
具身智能
Psi-R2
Psi-W0
Vero
Genie Sim
ORCA Lab 1.0
Genie Studio Agent
LatentUM
深度求索 DeepSeek
NVIDIA
AWE3.0
GO-2基础模型
追觅
DAPO
ABot-N0
SocialNav
Sudo R1
IHIQL
ICRL
GCMBC
NMR
Genie Envisioner 2.0
ADS
隐空间世界模型
破壳机器人
Momenta R7
talkie
应用于 (18)
AI Agent
AI金融
人形机器人
广告推荐
机器人
AI教育
具身智能
代码生成
视觉推理
ViVa
自动驾驶
AI安全
Agent
开发者大会
自动驾驶
家庭机器人
AI对齐
AI竞赛
创建 (1)
吴翼
使用 (1)
索尼
相关文章 (51)
1.
甲子光年 - AI不再拼参数,胜负手在模型之外|甲子光年
2.
机器之心 - 重构跨域RL框架!理论驱动「双重对齐」让跨域迁移「质变」
3.
量子位 - 开盒ClaudeCode的原来是中国00后!曾怒怼Anthropic窃取用户代码
4.
机器之心 - HSImul3R:给三维交互重建装上物理大脑
5.
智东西 - 看草图直出代码!实测智谱最新多模态Coding模型
6.
MacTalk - 其他家在接入龙虾的时候,快手默默上线了一套硬核技术
7.
具身智能之心 - 秋招&社招预热|上车!从VLA到世界模型,走好具身落地的每一步
8.
量子位 - 中国具身模型狂揽全球第一!机器人的人类数据时代来了
9.
具身智能之心 - 极佳视界发布ViVa:用视频生成模型给机器人动作“打样”,让VLA强化学习不再“走弯路”
10.
量子位 - Nature封面:机器人乒乓球干翻人类职业选手
11.
AI科技评论 - 独家|拿下5亿元海外订单,无界动力完成天使++轮融资,天使轮累计融资超2亿美元
12.
PaperWeekly - TPAMI2026当考试开始“因人出题”:中科大发布首篇自适应测评综述
13.
AI前线 - 10岁孩子都能训机器人!对话松应科技创始人:做物理AI界的“安卓”挑战英伟达,正将其开源开放
14.
具身智能之心 - 每次都是吊打!VLA根本不缺SOTA,缺的是能够完整工程化的链路......
15.
智能涌现 - 「破壳机器人」许华哲:两年内,中国将出现可用的家庭机器人
16.
DeepTech深科技 - 对话许华哲:进家的机器人,先做好这10件事
17.
AI寒武纪 - Karpathy点透AI认知撕裂:顶级圈子正集体患上AI狂热症
18.
具身智能之心 - GenieEnvisioner2.0正式发布!WAM与仿真器的双向进化!一个真正属于具身的物理引擎
19.
机器之心 - 「10万小时人类数据」不搞对齐只靠规模,灵初智能Psi-R2登顶MolmoSpaces!
20.
具身智能之心 - 把世界模型做成“转译层”:灵初智能发布Psi-R2、Psi-W0与10万小时HumanData
21.
新智元 - 中国具身屠榜全球!10万小时数据炸场,PI、英伟达集体破防
22.
AI异类弗兰克 - 主持了灵初智能的发布会,00后联创源培让我很佩服
23.
量子位 - 刘壮陈丹琦新作:开源通用视觉推理RL框架,0思考数据刷新SOTA
24.
前沿在线 - 智元仿真平台GenieSim3.0迎来新升级,自然语言生成3D世界前沿在线
25.
InfoQ - 10岁孩子都能训机器人!对话松应科技创始人:做物理AI界的“安卓”挑战英伟达,正将其开源开放
26.
具身智能之心 - 机器人的部署,可以零代码了!VLA、强化学习、视觉感知、运动控制和导航规划都支持
27.
前沿在线 - 智元发布GenieStudioAgent,面向具身作业场景的零代码应用平台前沿在线
28.
机器之心 - 上海交大DENGLab提出「LatentUM」:UnifiedModel的真正「战场」在视觉推理与世界模型
29.
深度学习与NLP - 入职Meta的吴翼,清华叉院官网已撤其教职信息
30.
雷峰网 - 金立创始人刘立荣消失8年后最新动向:疑在印尼卖家具;月薪3万,DeepSeek聘人去内蒙草原守机房;比亚迪坪山园区大火,
下滑加载更多...(已显示 30 / 51)