RL

技术

RL（强化学习），通过与环境交互获取奖励反馈来优化决策策略的方法，典型应用于自动驾驶、游戏博弈和机器人控制

30 次提及37 个连接首次出现: 2026-03-30最近出现: 2026-06-24

关系图谱

关系 (40)

相关文章 (30)