Wesum AI
首页
图谱
主题百科
首页
/
图谱
/
Deep RL
Deep RL
技术
深度强化学习,通过梯度下降更新神经网络参数的传统强化学习方法
1 次提及
3 个连接
首次出现: 2026-05-09
最近出现: 2026-05-09
关系图谱
关系 (3)
竞争 (1)
Heuristic Learning
应用于 (1)
游戏AI
基于 (1)
PPO
相关文章 (1)
1.
机器之心 - OpenAI翁家翌:梯度之外,下一个AI训练范式有着落了?