在此 notebook 中,我们将构建一个可以通过强化学习学会玩游戏的神经网络。具体而言,我们将使用 QQ-学习训练智能体玩一个叫做 Cart-Pole 的游戏。在此游戏中,小车上有一个可以自由摆动的杆子。小车可以向左和向右移动,目标是尽量长时间地使杆子保持笔直。
Q-Learning Update和固定Q目标
Q学习很容易受到一种联系的影响,Q学习是一种时间差分(TD)学习,这里红色部分:R + y * 下个状态的最大潜在值。称之为TD目标。 read more
强化学习-蒙特卡洛方法预测动作值
给一个策略π,预测 qπ。在动态规划中,我们可以使用状态值函数获取动作值函数: read more
强化学习-蒙特卡洛异同策略方法
智能体通过遵循某个策略与环境互动,并计算该策略的函数,就是异同策略方法。再详细讲解该算法之前,我们先来了解一个实例。 read more
BasicLSTMCell
class BasicLSTMCell(RNNCell):
基本的LSTM循环网络单元 read more
Tensorflow的GPU支持模式下的安装要点
其实Tensorflow在GPU支持模式下的安装并不困难,严格按照其官方文档就可以了。但整个 过程比较长,中间一些步骤注意不到也可能出错。这里列出要点和排错指南。 read more
python中需求文件requirements.txt的创建及使用
python项目中必须包含一个 requirements.txt 文件,用于记录所有依赖包及其精确的版本号。以便新环境部署。 read more
conda创建python虚拟环境
1、首先在所在系统中安装Anaconda。可以打开命令行输入conda -V检验是否安装以及当前conda的版本。 read more
AI界不错的博主
https://www.leiphone.com/author/AI%E7%A0%94%E4%B9%A0%E7%A4%BE394 AI研习社 2018年不再更新
https://www.leiphone.com/author/leifengzimuzu2326 雷锋字幕组
https://www.zhihu.com/people/zhao-xie-yu-30/posts 知乎中的青年才俊
ImportError:no module named tensorflow解决办法
环境:windows10,64位
python报错: read more