用户小人物0104 联合开发网

Pudn.com > 用户

小人物0104

积分：426
上传文件：5
下载次数：2
注册日期：2019-12-04 10:37:43

上传列表：

Proximal_Policy_Optimization.zip - 强化学习可以按照方法学习策略来划分成基于值和基于策略两种。而在深度强化学习领域将深度学习与基于值的Q-Learning算法相结合产生了DQN算法，通过经验回放池与目标网络成功的将深度学习算法引入了强化学习算法。,2019-12-04 10:54:55,下载18次
A3C.zip - AC算法框架被广泛应用于实际强化学习算法中，该框架集成了值函数估计算法和策略搜索算法，是解决实际问题时最常考虑的框架。大家众所周知的alphago便用了AC框架。而且在强化学习领域最受欢迎的A3C算法，DDPG算法，PPO算法等都是AC框架。我们这一讲便总结下AC算法的发展并介绍目前最受关注的A3C算法和PPO算法,2019-12-04 10:52:53,下载2次
Hierarchical-DQNr.zip - 传统的表格形式的强化学习有这样一个瓶颈，用表格来存储每一个状态 state, 和在这个 state 每个行为 action 所拥有的 Q 值. 而当今问题是在太复杂, 状态可以多到比天上的星星还多(比如下围棋). 如果全用表格来存储它们, 恐怕我们的计算机有再大的内存都不够, 而且每次在这么大的表格中搜索对应的状态也是一件很耗时的事.?,2019-12-04 10:51:12,下载1次
afsa.zip - 在一片水域中，鱼往往能自行或尾随其他鱼找到营养物质多的地方，因而鱼生存数目最多的地方一般就是本水域中营养物质最多的地方，人工鱼群算法就是根据这一特点，通过构造人工鱼来模仿鱼群的觅食、聚群及追尾行为，从而实现寻优。,2019-12-04 10:45:16,下载3次
VMD.zip - 变分模态分解程序，可用于信号分解等领域，实现信号的分离,2019-12-04 10:43:00,下载3次

近期下载：

收藏：