我们来看三个重要的改进:
– 双DQN
– 优先回放
– 对抗网络
该算法中有两个交错的主要流程。
第一个流程是对环境取样,方法是执行动作,并以回放存储器的形式,存储观察的经验元祖。 read more
深度卷积对抗网络简称DCGAN,这些GAN给你之前使用MNIST数据库构建差不多,但是这次的生成器和辨别器用神经网络构建,有关于DCGAN原始论文请看:https://arxiv.org/pdf/1511.06434.pdf。他的技术性不是特别强,并提供了关于这些东西训练的一些好建议。确保你在构建过程中,阅读它。 read more
我们将在MNIST数据集中来训练生成对抗网络(GAN),并使用训练后的网络,生成一个新的手写数字。 read more
在windows10使用tensorflow1.0.0和python3.5的环境下,我的cuda使用的9.0。 read more
基本的LSTM细胞单元在TensorFlow中声明为:
tf.contrib.rnn.BasicLSTMCell(num_units) read more
我们有一个【1 2 3 4 5 6 7 8 9 10 11 12】数字序列。
我们希望将他传递给RNN,但是为了更好的训练,我们可以将它拆分为两个部分。 read more
下图是一个前馈网络,包含 read more