电子书:《强化学习》《强化学习》赵地等译

电子书:《强化学习》《强化学习》赵地等译

资源下载
仅限VIP下载,请先
犹豫不决让我们错失一次又一次机会!!!

电子书:《强化学习》《强化学习》赵地等译

111

内容简介:

grenforcement learningstate-of-the-art强化学习马可·威宁( marco wiering[荷】马丁·范·奥特罗( martijn van oter编著赵地刘莹邓仰东欧阳建权苏统华个g想出盐

图书在版编目(c|p)数据马可·威宁( marco wiering).(荷)马丁·范·奥特罗( martijn vanotterlo)编著;赵地等译.一北京:机械工业出版社.2018(智能科学与技术丛书)书名原文: reinforcement learning: state-of-the-artisbn978-7-111-60022-0i.强…i1.①马…②马…③赵…ⅲ.机器学习ⅳv.tp181中guo版本图书馆cp数据核字(2018)第110203号本书版权登记号:图字01-20166249translation from the english language edition: reinforcement leaming: state-of-the-art editedby marco wiering and martin van otterlocopyright o springer-verlag berlin heidelberg 2012.springer is part of springer science+ business mediaall rights reserved.本书中文简体字版由 springer授权机械工业出版社独家出版。未经出版者书面许可.不得以任何方式复制或抄袭本书内容本书包括六大部分.详细介绍了强化学习中各领域的基本理论和研究内容.内容包括:mdp、动态规划、蒙特卡罗方法、批处理强化学习、td学习、q学习、策略选代的最小二乘法、迁移学习、贝叶斯强化学习、一阶逻辑mdp、层次式强化学习、演化计算、预测性定义状态表示、去中心化的部分可观察mdp、博奔论和多学习器强化学习等内容.并述强化学习与心理和神经科学、游戏领域、机器人领域的关系和应用.有助于研究者了解强化学习领域.发现新的研究方向本书适合作为高等院校机器学习、人工智能相关课程的参考书.也可作为人工智能领域技术人员的参考用书出版发行:机械工业出版社(土京市西精区百万庄大街22号政接码:100037责任编辑:唐晓琳责任校对:殷虹印刷:北京市兆成印刷有限责任公司版次:2018年6月第1版第1次印刷开本:185mmx260mm1/16印张:30.5书号:isbn978-7-11定价:119.00元凡购本书.如有缺页、倒页、了投稿热线010)8837960468995259读者信箱: hzjsjt@ hzbook con版权所有·侵权必究

reinforcement learning: state-of-the-ar强化学习在越来越多的实际问题中取得了突破性成果。基于强化学习的 alphago围棋程序连挫人类围棋冠军.赚足了眼球.而随后出现的新一代 alphago zero则以100:0大败alphal。 alphago是谷歌旗下 deepmind公司研发的人工智能下棋软件.主要由策略网络policy network)、快速走子( fast rollout)、价值网络( value network)三个部分组成.并通过蒙特卡罗树搜索( monte carlo tree search)把三个部分有机连接.形成一个完整的系统。升级版的 alphago zero最大限度地降低了人类棋谱的先验知识.完全通过强化学习的我对弈提升棋力.青出于蓝而胜于蓝。现在强化学习的主攻热点转向了游戏以及机器人领域.强化学习在解决更多实际问题方面大有可为.同时也激发起强化学习研究领域的活力和热度强化学习是机器学习中与监督学习以及无监督学习平行的一种类型.它是(自主)智能体完成与外界环境交互任务的重要手段.通过最大化奖励函数的学习方法获取从环境状态到行为的映射函数。强化学习成为一个独立研究分支已有超过50年的历史.而20世纪80年代提出的马尔可夫决策过程( markov decision proces.mdp)构成了现代强化学习的基本描述框架。之后强化学习在理论、算法、应用上取得了长足的发展。对于真正想要在强化学习领域进行创新研究的学者而言.需要扎扎实实地研读强化学习方面的经典书籍和文献本书的编著者开篇就提出了目标:写一本值得向同学、同事及领域研究者推荐的讨论强化学习最新技术的好书。本书的特色鲜明.值得一读。第一是主题新颖。本书主要聚焦于发生在2000年到2012年间的最新发展。我们可以从第二~四部分看到发生在强化学习领域的最新动向和最新技术。撰写本书的作者以年轻学者为主.这也从一个侧面印证了本书的新颖度。第二是体例完整、涵盖的研究领域广泛。本书包含19章.其中第1章对强化学习的基本算法和框架做了全面的介绍.之后的17章对常规解决框架、构建性问题表示、概率建模手段以及经典应用领域进行详细评述.而最后一章则纵览全书进行讨论和发散。第三是组织精巧。内容从前到后具有一定的递增性.但又保持了各部分的相对独立性.方便读者根据兴趨选读相应篇章。最后.本书时刻围绕前沿性和开放性问题。作者在大胆发表自己的真知烁见的同时.不忘客观地审视当前的不足。这是本书不同于市面上很多书籍的重要特质。所以本书可以让你迅速跟上强化学习的发展现状。本书的翻译工作由中guo科学院计算机网络信息中心的赵地研究员发起并组建翻译团队其中赵地研究员负责第1、2和8章的翻译工作.中guo科学院大学的刘莹教授负责前言、第3~7章和第12章的翻译任务.清华大学的邓仰东教授承担第9~11章的翻译工作.湘潭大学的欧阳建权教授主持第13~16章的翻译.最后第17~19章的翻译由哈尔滨工业大学的苏统华教授完成。除了每章的负责人.还有很多研究生参与了部分翻译工作.特此向他们表示感谢本书几乎涵盖了经典强化学习的全部内容.甚至包括作为深度强化学习萌芽的重要成果dfq。但毕竟因时间问题未能及时顾及最近几年才发展出来的更多深度强化学习技术。我们

的翻译团队也期待能在未来再次合作.推出围绕深度强化学习的专著由于本书涉及的广度和深度较大.加上译者水平有限.译文中难免存在一些问题.真诚地希望读者朋友们批评指正最后要向机械工业出版社的朱劼编辑和唐晓琳编辑表示深深的谢意.她们在流程管理和宇编辑上提供的帮助对于本书的顺利出版至关重要2018年4月

言化学习是一门有50多年历史的学科.但是.由于受到马尔可夫决策过程理论的影响其现代形式在20世纪80年代才逐渐兴起.并于90年代后期在教科书中建立起了完整的体系。在本书中. martijn van otterlo和 marco wiering这两位在该领域备受尊敬的、活跃的研究人员通过委托撰写.汇编出版了21世纪以来描述强化学习主要发展的一系列文章。这些文章都是综述而不是创新研究.每一篇都很权威地论述了强化学习的一个领域.包括神经和行为等方面的研究以及计算方面的考虑。对想要更进一步学习的学生和研究最新动态的科研人员来说.本书是一个宝贵的资源本人在这个领域已经工作了很长时间.这些文章的作者有两个突出的特点。第一.他们都很年轻。其中16篇文章的第一作者都是在过去7年内获得博士学位的(有些仍然是学生)。这无疑是一个非常好的信号.说明这个领域正在重生并十分具有活力。第二.三分之二的作者来自欧洲。部分原因是由于本书的编辑来自欧洲.这似乎也反映出强化学习研究的重心正在东移.从北美洲移到了欧洲richard s. sutton2011年10月

资源下载
下载价格VIP专享
仅限VIP下载升级VIP
犹豫不决让我们错失一次又一次机会!!!
原文链接:https://1111down.com/222957.html,转载请注明出处

本站开启缓存功能

登入后回任何页面即可登入成功,当前页不显示

没有账号?注册  忘记密码?

社交账号快速登录