keras
在文章 openai-gym入门 中
在文章 OpenAI-Gym入门 中,我们以 CartPole-v1 环境为例学习了 OpenAI Gym 的基本用法。在文章 OpenAI-Gym神经网络策略及其训练 中,我们依然是以 CartPole-v1 为例,学习了策略梯度算法及其实现,并用 Keras 实际训练了一个神经网络策略。 在实际业务场景中,我们需要自己实现环境,也就是继承 gym.Env,然后重新实现 reset step render 等函数