DQN 改进

我们来看三个重要的改进:

–  双DQN

–  优先回放

–  对抗网络

read more »

深度Q学习算法

该算法中有两个交错的主要流程。

第一个流程是对环境取样,方法是执行动作,并以回放存储器的形式,存储观察的经验元祖。 read more »

深度卷积对抗网络

深度卷积对抗网络简称DCGAN,这些GAN给你之前使用MNIST数据库构建差不多,但是这次的生成器和辨别器用神经网络构建,有关于DCGAN原始论文请看:https://arxiv.org/pdf/1511.06434.pdf。他的技术性不是特别强,并提供了关于这些东西训练的一些好建议。确保你在构建过程中,阅读它。 read more »

生成对抗网络

我们将在MNIST数据集中来训练生成对抗网络(GAN),并使用训练后的网络,生成一个新的手写数字。 read more »

RNN下序列分批

我们有一个【1 2 3 4 5 6 7 8 9 10 11 12】数字序列。

我们希望将他传递给RNN,但是为了更好的训练,我们可以将它拆分为两个部分。 read more »

第 1 页,共 2 页12