DDPG

技术

DDPG，结合确定性策略梯度与深度 Q 网络的强化学习算法，擅长处理连续动作空间的控制问题，常用于机器人控制等场景

1 次提及1 个连接首次出现: 2026-04-25最近出现: 2026-04-25

关系图谱

关系 (1)

应用于 (1)

相关文章 (1)