深度 Q -学习

在此 notebook 中,我们将构建一个可以通过强化学习学会玩游戏的神经网络。具体而言,我们将使用 QQ-学习训练智能体玩一个叫做 Cart-Pole 的游戏。在此游戏中,小车上有一个可以自由摆动的杆子。小车可以向左和向右移动,目标是尽量长时间地使杆子保持笔直。

cart-pole201807042138 read more »

Q-Learning Update和固定Q目标

20180703122321

Q学习很容易受到一种联系的影响,Q学习是一种时间差分(TD)学习,这里红色部分:R + y * 下个状态的最大潜在值。称之为TD目标。 read more »

Tensorflow的GPU支持模式下的安装要点

其实Tensorflow在GPU支持模式下的安装并不困难,严格按照其官方文档就可以了。但整个 过程比较长,中间一些步骤注意不到也可能出错。这里列出要点和排错指南。 read more »

conda创建python虚拟环境

1、首先在所在系统中安装Anaconda。可以打开命令行输入conda -V检验是否安装以及当前conda的版本。 read more »

AI界不错的博主

https://www.leiphone.com/author/AI%E7%A0%94%E4%B9%A0%E7%A4%BE394    AI研习社 2018年不再更新

https://www.leiphone.com/author/leifengzimuzu2326    雷锋字幕组

https://www.zhihu.com/people/zhao-xie-yu-30/posts   知乎中的青年才俊

第 2 页,共 4 页1234