2018年7月4日2021年4月18日

深度 Q -学习

在此 notebook 中，我们将构建一个可以通过强化学习学会玩游戏的神经网络。具体而言，我们将使用 Q-学习训练智能体玩一个叫做 Cart-Pole 的游戏。在此游戏中，小车上有一个可以自由摆动的杆子。小车可以向左和向右移动，目标是尽量长时间地使杆子保持笔直。

2018年7月3日2021年4月18日

Q-Learning Update和固定Q目标

20180703122321

Q学习很容易受到一种联系的影响，Q学习是一种时间差分（TD）学习，这里红色部分：R + y * 下个状态的最大潜在值。称之为TD目标。 read more »

2018年7月1日2021年4月18日

给一个策略π，预测 qπ。在动态规划中，我们可以使用状态值函数获取动作值函数： read more »

2018年6月30日2021年4月18日

智能体通过遵循某个策略与环境互动，并计算该策略的函数，就是异同策略方法。再详细讲解该算法之前，我们先来了解一个实例。 read more »

2018年6月24日2021年4月18日

class BasicLSTMCell(RNNCell):

基本的LSTM循环网络单元 read more »

2018年6月24日2021年4月18日

其实Tensorflow在GPU支持模式下的安装并不困难，严格按照其官方文档就可以了。但整个过程比较长，中间一些步骤注意不到也可能出错。这里列出要点和排错指南。 read more »

2018年6月23日2021年4月18日

python项目中必须包含一个 requirements.txt 文件，用于记录所有依赖包及其精确的版本号。以便新环境部署。 read more »

2018年6月23日2021年4月18日

1、首先在所在系统中安装Anaconda。可以打开命令行输入conda -V检验是否安装以及当前conda的版本。 read more »

2018年6月22日2021年4月18日

https://www.leiphone.com/author/AI%E7%A0%94%E4%B9%A0%E7%A4%BE394 AI研习社 2018年不再更新

https://www.leiphone.com/author/leifengzimuzu2326 雷锋字幕组

https://www.zhihu.com/people/zhao-xie-yu-30/posts 知乎中的青年才俊

2018年6月19日2021年4月18日

环境：windows10,64位

python报错： read more »

第 2 页，共 4 页«123 4 »