Cyihts

积分:244
上传文件:1
下载次数:0
注册日期:2018-12-27 19:37:01

上传列表
hw3-code.zip - 这是强化学习关于动态规划的例子,我们需要让智能体自己找到最好的策略。环境是一个5*5的格子,只有走到正确的格子下才能够获得奖励。通过这个例子对动态规划能有一个很好的了解。,2018-12-27 19:40:58,下载4次

近期下载

收藏