ppo算法与ddpg算法区别

187次

问题描述:

ppo算法与ddpg算法区别急求答案,帮忙回答下

推荐答案

2024-01-09 21:33:01

PPO是目前非常流行的增强学习算法。

DDPG也是解决连续控制型问题的的一个算法,不过和PPO不一样,PPO输出的是一个策略,也就是一个概率分布,而DDPG输出的直接是一个动作。DDPG是一种入门算法,效果远不及PPO。

(c)2008-2025 自学教育网 All Rights Reserved 汕头市灵创科技有限公司
粤ICP备2024240640号-6