rl-cn

所属分类:人工智能/神经网络/深度学习
开发工具:TeX
文件大小:9675KB
下载次数:0
上传日期:2018-08-20 08:11:29
上 传 者sh-1993
说明:  rl-cn,强化学习的翻译:导论
(rl-cn,A translation of Reinforcement Learning: An Introduction)

文件列表:
src (0, 2018-08-20)
src\c0 (0, 2018-08-20)
src\c0\frontmatter.tex (21983, 2018-08-20)
src\c0\img (0, 2018-08-20)
src\c0\img\cover.pdf (3166486, 2018-08-20)
src\c1 (0, 2018-08-20)
src\c1\img (0, 2018-08-20)
src\c1\img\figure1-1.pdf (928587, 2018-08-20)
src\c1\img\tic-tac-toc.pdf (203849, 2018-08-20)
src\c1\introduction.tex (36491, 2018-08-20)
src\c2 (0, 2018-08-20)
src\c2\img (0, 2018-08-20)
src\c2\img\figure2-1.pdf (288966, 2018-08-20)
src\c2\img\figure2-2.pdf (339864, 2018-08-20)
src\c2\img\figure2-3.pdf (315078, 2018-08-20)
src\c2\img\figure2-4.pdf (1435309, 2018-08-20)
src\c2\img\figure2-5.pdf (1271790, 2018-08-20)
src\c2\img\figure2-6.pdf (222145, 2018-08-20)
src\c2\multi-armed_bandits.tex (50510, 2018-08-20)
src\c3 (0, 2018-08-20)
src\c3\finite_MDPs.tex (66848, 2018-08-20)
src\c3\img (0, 2018-08-20)
src\c3\img\action_value_backup_diagram.pdf (188361, 2018-08-20)
src\c3\img\action_value_ito_state_value.pdf (218185, 2018-08-20)
src\c3\img\backup_diagram.pdf (190953, 2018-08-20)
src\c3\img\dynamics_table.pdf (98721, 2018-08-20)
src\c3\img\exercise3-22.pdf (272729, 2018-08-20)
src\c3\img\figure3-1.pdf (229343, 2018-08-20)
src\c3\img\figure3-2.pdf (332478, 2018-08-20)
src\c3\img\figure3-3.pdf (316665, 2018-08-20)
src\c3\img\figure3-4.pdf (201773, 2018-08-20)
src\c3\img\figure3-5.pdf (268694, 2018-08-20)
src\c3\img\mdp.pdf (242772, 2018-08-20)
src\c3\img\pole-balancing.pdf (167139, 2018-08-20)
src\c3\img\state_value_ito_action_value.pdf (196761, 2018-08-20)
src\c3\img\transition_graph.pdf (192919, 2018-08-20)
src\rl-cn.bib (3932, 2018-08-20)
... ...

# 项目介绍 ## 概述 本项目是对[Richard S. Sutton](http://incompleteideas.net/index.html)和 [Andrew G. Barto](http://www-anw.cs.umass.edu/~barto/)著的*[Reinforcement Learning: An Introduction](http://incompleteideas.net/book/the-book-2nd.html)*第二版的中文翻译. 使用LaTeX作为排版工具, 使用[GitHub](https://github.com/rl-cn/rl-cn)作为源码托管平台. ## 当前进度 当前翻译了部分序言以及前3章. ## 翻译的约定 1. 由于作者在书中许多地方使用了圆括号, 所以在强化学习术语的英文对照使用尖括号括起来以示区分. 2. 书中的我们有时指两名作者, 有时指包括读者在内的我们, 请具体分析. 3. 伪代码中的英文能不翻译就不翻译. 4. 有些内容关联较小, 如"参考文献"等, 因此部分内容暂时不译. ## 联系我们 如果对翻译的内容有任何疑问, 欢迎发布Issue或联系项目组(rlcnproj@gmail.com). ## 加入我们 如果对强化学习及翻译有兴趣, 欢迎联系(rlcnproj@gmail.com)加入到项目中.

近期下载者

相关文件


收藏者