Wesum AI

DDPG

技术

DDPG,结合确定性策略梯度与深度 Q 网络的强化学习算法,擅长处理连续动作空间的控制问题,常用于机器人控制等场景

1 次提及1 个连接首次出现: 2026-04-25最近出现: 2026-04-25

关系图谱

关系 (1)

应用于 (1)

相关文章 (1)