rl-cn
所属分类:人工智能/神经网络/深度学习
开发工具:TeX
文件大小:9675KB
下载次数:0
上传日期:2018-08-20 08:11:29
上 传 者:
sh-1993
说明: rl-cn,强化学习的翻译:导论
(rl-cn,A translation of Reinforcement Learning: An Introduction)
文件列表:
src (0, 2018-08-20)
src\c0 (0, 2018-08-20)
src\c0\frontmatter.tex (21983, 2018-08-20)
src\c0\img (0, 2018-08-20)
src\c0\img\cover.pdf (3166486, 2018-08-20)
src\c1 (0, 2018-08-20)
src\c1\img (0, 2018-08-20)
src\c1\img\figure1-1.pdf (928587, 2018-08-20)
src\c1\img\tic-tac-toc.pdf (203849, 2018-08-20)
src\c1\introduction.tex (36491, 2018-08-20)
src\c2 (0, 2018-08-20)
src\c2\img (0, 2018-08-20)
src\c2\img\figure2-1.pdf (288966, 2018-08-20)
src\c2\img\figure2-2.pdf (339864, 2018-08-20)
src\c2\img\figure2-3.pdf (315078, 2018-08-20)
src\c2\img\figure2-4.pdf (1435309, 2018-08-20)
src\c2\img\figure2-5.pdf (1271790, 2018-08-20)
src\c2\img\figure2-6.pdf (222145, 2018-08-20)
src\c2\multi-armed_bandits.tex (50510, 2018-08-20)
src\c3 (0, 2018-08-20)
src\c3\finite_MDPs.tex (66848, 2018-08-20)
src\c3\img (0, 2018-08-20)
src\c3\img\action_value_backup_diagram.pdf (188361, 2018-08-20)
src\c3\img\action_value_ito_state_value.pdf (218185, 2018-08-20)
src\c3\img\backup_diagram.pdf (190953, 2018-08-20)
src\c3\img\dynamics_table.pdf (98721, 2018-08-20)
src\c3\img\exercise3-22.pdf (272729, 2018-08-20)
src\c3\img\figure3-1.pdf (229343, 2018-08-20)
src\c3\img\figure3-2.pdf (332478, 2018-08-20)
src\c3\img\figure3-3.pdf (316665, 2018-08-20)
src\c3\img\figure3-4.pdf (201773, 2018-08-20)
src\c3\img\figure3-5.pdf (268694, 2018-08-20)
src\c3\img\mdp.pdf (242772, 2018-08-20)
src\c3\img\pole-balancing.pdf (167139, 2018-08-20)
src\c3\img\state_value_ito_action_value.pdf (196761, 2018-08-20)
src\c3\img\transition_graph.pdf (192919, 2018-08-20)
src\rl-cn.bib (3932, 2018-08-20)
... ...
# 项目介绍
## 概述
本项目是对[Richard S. Sutton](http://incompleteideas.net/index.html)和 [Andrew G. Barto](http://www-anw.cs.umass.edu/~barto/)著的*[Reinforcement Learning: An Introduction](http://incompleteideas.net/book/the-book-2nd.html)*第二版的中文翻译. 使用LaTeX作为排版工具, 使用[GitHub](https://github.com/rl-cn/rl-cn)作为源码托管平台.
## 当前进度
当前翻译了部分序言以及前3章.
## 翻译的约定
1. 由于作者在书中许多地方使用了圆括号, 所以在强化学习术语的英文对照使用尖括号括起来以示区分.
2. 书中的我们有时指两名作者, 有时指包括读者在内的我们, 请具体分析.
3. 伪代码中的英文能不翻译就不翻译.
4. 有些内容关联较小, 如"参考文献"等, 因此部分内容暂时不译.
## 联系我们
如果对翻译的内容有任何疑问, 欢迎发布Issue或联系项目组(rlcnproj@gmail.com).
## 加入我们
如果对强化学习及翻译有兴趣, 欢迎联系(rlcnproj@gmail.com)加入到项目中.
近期下载者:
相关文件:
收藏者: