深度 Q -学习

在此 notebook 中,我们将构建一个可以通过强化学习学会玩游戏的神经网络。具体而言,我们将使用 QQ-学习训练智能体玩一个叫做 Cart-Pole 的游戏。在此游戏中,小车上有一个可以自由摆动的杆子。小车可以向左和向右移动,目标是尽量长时间地使杆子保持笔直。

cart-pole201807042138 read more »

DQN 改进

我们来看三个重要的改进:

–  双DQN

–  优先回放

–  对抗网络

read more »

深度Q学习算法

该算法中有两个交错的主要流程。

第一个流程是对环境取样,方法是执行动作,并以回放存储器的形式,存储观察的经验元祖。 read more »

Q-Learning Update和固定Q目标

20180703122321

Q学习很容易受到一种联系的影响,Q学习是一种时间差分(TD)学习,这里红色部分:R + y * 下个状态的最大潜在值。称之为TD目标。 read more »

深度卷积对抗网络

深度卷积对抗网络简称DCGAN,这些GAN给你之前使用MNIST数据库构建差不多,但是这次的生成器和辨别器用神经网络构建,有关于DCGAN原始论文请看:https://arxiv.org/pdf/1511.06434.pdf。他的技术性不是特别强,并提供了关于这些东西训练的一些好建议。确保你在构建过程中,阅读它。 read more »

生成对抗网络

我们将在MNIST数据集中来训练生成对抗网络(GAN),并使用训练后的网络,生成一个新的手写数字。 read more »

第 2 页,共 6 页12345...最旧 »