多种网盘链接检测插件 购买前,请先检测网盘链接是否有效
《强化学习精要 核心算法与TensorFlow实现》_冯超_1
《强化学习精要 核心算法与TensorFlow实现》_冯超_2
《强化学习精要 核心算法与TensorFlow实现》_冯超_3
内容简介:
强化学习精要
核心算法与 TensorFlow实现
MA超◎著
书籍是人类进步的阶梯
内容简介
《强化学习精要:核心算法与 TensorFlow实现》用通俗幽默的语言深人浅出地介绍
了强化学习的基本算法与代码实现,为读者构建了一个完整的强化学习知识体系,同
时介绍了这些算法的具体实现方式。从基本的MA尔可夫决策过程,到各种复杂的强化
学习算法,读者都可以从本书中学习到。本书除了介绍这些算法的原理,还深入分析了
算法之间的内在联系,可以帮助读者举一反三,掌握算法精髓。书中介绍的代码可以帮
助读者快速将算法应用到实践中。
《强化学习精要:核心算法与 Tensor Flow实现》内容翔实,语言简洁易懂,既适合
零基础的人员入门学习,也适合相关科研人员研究参考。
未经许可,不得以任何方式复制或抄袭本书之部分或全部内容。
版权所有,侵权必究。
图书在版编目(CIP)数据
强化学习精要:核心算法与 TensorFlow实现/冯超著一北京:电子工业出版社,20186
(博文视点AI系列)
ISBN 978-7
000-0
L.①强…Ⅱ.①冯…Ⅲl①机器学习一算法一研究ⅣTP181
中guo版本图书馆CIP数据核字(2018)第068910号
策划编辑:郑柳洁
印刷:天津嘉恒印务有限公司
装订:天津嘉恒印务有限公司
出版发行:电子工业出版社
北京市海淀区万寿路173信箱邮编:100036
开本:720×1000116印张:24字数:470千字
版次:2018年6月第1版
印次:2018年6月第1次印刷
定价:80.00元
凡所购买电子工业出版社图书有缺损问题,请向购买书店调换。若书店售缺,请与
本社发行部联系,联系及邮购电话010)882548888258888
质量投诉请发邮件至zs@phei.com.cn,盗版侵权举报请发邮件至dbqq@phei.com.cn
本书咨询联系方式010)5126088819faq@phei.com.cn.
书籍是人类进步的阶梯
前言
从你拿起本书的那一刻起,我们就一起踏上了这段有关强化学习的冒险之旅。本
书中有简单直白的叙述,也有复杂冗长的证明;有诙谐幽默,也有深刻的思考。所有的
切,都是为了帮助你更轻松地对强化学习有更多了解、更多感悟。
年之前,我在拙作《深度学习轻松学:核心算法与视觉实践》中,同样以这段话
作为开篇,唯一不同的是这一次书的主题换成了强化学习。近年来,强化学习领域有了
很大的发展,基于强化学习开发的智能体也被人们熟知。于是越来越多的人开始关注
匕学习,了解这个领域,并使用强化学习的方法解决问题。随着深度学习的发展,强
化学习也逐渐发挥出了自己的实力,凭借更灵活的问题定义方式,解决了很多其他方
法难以解决的问题。
虽然强化学习这个领域已经有了多年的积累与发展,但是与深度学习相比,guo内
外与此相关的书籍与课程偏少。同时,由于强化学习融合了很多领域的知识,本身的技
术难度较大,学习起来比较困难。两者叠加,使得强化学习仍然是一个令很多人感到困
惑的概念。
为了学习强化学习中的各种知识,作为本书的作者,我也花费了很多的精力。在阅
读了很多经典的书籍、论文和博客之后,我开始对强化学习有了自己的理解和体会。同
时也积累了不少关于强化学习的“学习笔记”,其中的一部分已经在一些公开场合
如我的知乎专栏《无痛的机器学习》(htps/ huanlan zhihu. com/hsmyy)中与读者分享
过。在交流的过程中,我能感受到读者对强
趣,同时自己也在分享中得
到了提高
经过长时间的积累,这些心得与体会最终凝结成了本书。在这个过程中我重新回
顾了自己所学的知识,也进一步思考了强化学习各部分知识点之间的联系。我希望可
以给大家呈现一个尽可能完整而丰富的强化学习世界,与大家共同探讨强化学习中的
无限可能。
为了使更多的人能够从本书中得到收获,我选择强化学习中比较经典的算法进行
了介绍,这些都是强化学习中十分重要的内容,对不了解强化学习的读者来说,可以帮
助你快速了解强化学习的知识体系,对这个领域有一个全面的认识;对正在学习强化
书籍是人类进步的阶
学习的读者来说,本书中的知识同样可以帮助你梳理强化学习的核心要点,加深对这
些基本问题的理解
在编写这本书的过程中,我又一次体会到求知的艰辛。获取知识的道路总是充满
荆棘,除了自身不断地努力,更少不了身边人对我的支持鼓励。感谢家人对我的理解与
支持,感谢编辑郑柳洁女土再次成为我的伯乐,为我提供了很多帮助,感谢Liu晓鸣先
生为本书绘制了大量插图。我相信我们的努力付出会使更多的人享受获得知识的快乐
由于本人才疏学浅,行文间难免有所纰漏,望各位读者多多包涵,不吝赐教
读者服务
轻松注册成为博文视点社区用户(www.broadview.com.cn),扫码直达本书页面
·下载资源:本书提供示例代码资源文件,可在【下载资源】处下载
提交勘误:您对书中内容的修改意见可在【提交勘误】处提交,若被采纳,将获
赠博文视点社区积分(在您购买电子书时,积分可用来抵扣相应金额
与读者交流:在页面下方【读者评论】处留下您的疑问或观点,与其他读者一同
学习交流。
页面入口:hp:/ww. broadview. com. cn34000
目录
第一部分强化学习入门与基础知识
1引言
1.1强化学习的概念
11.1巴浦洛夫的狗
1.1.2俄罗斯方块
12站在被实验者的角度看问题
1.3强化学习效果的评估
1.3.1不断试错
13.2看重长期回报
2234588899
4强化学习与监督学习
14.1强化学习与监督学习的本质
142模仿学习
10
1.5强化学习的实验环境
1.5.1 Arcade Learning Environment
FuOco
1.5.4 Gym
1.6本书的主要内容
1.7参考资料
2数学与机器学习基础
17
2.1线性代数基础
22对称矩阵的性质
|
|