电子书：《揭秘深度强化学习》_彭伟《揭秘深度强化学习》

电子书：《揭秘深度强化学习》_彭伟《揭秘深度强化学习》_彭伟

111

内容简介：

彭伟. avatarworks人工智能实验室研究员.电子科技大学ee学士.厦门大学计算机硕士.具有良好的软硬件能力。目前主要从事人工智能、机器学习算法的研究主要的项目经历包括视觉目标跟踪、行人检.测、目标检.测、3d动画风格传输、虚拟机器人行为系统等.具有丰富的实战经验。扫码下载本书源文件

人工智能技术丛书揭秘深度强化学习彭伟编著qd来利谋电版姓

内容筒介度强化学习( deep reinforcement leaming.drl)是深度学习算法和强化学习算法的巧妙结合.它是一种新兴的通用人工智能算法技术.也是机器学习的前沿技术.drl算法潜力无限phago是目前该算法最成功的使用案例.drl算法以马尔科夫决策过程为基础.是在深度学习强大的非线性函数的拟合能力下构成的一种增强算法。深度强化学习算法主要包括基于动态规划(dp)的算法以及基于策略优化的算法.本书的目的就是要把这两种主要的算法(及设计技巧)讲解清楚.使算法研究人员能够熟练掌握《揭秘深度强化学习》共10章.首先以 alphal在围棋大战的伟大事迹开始.引起对人工智能发展和现状的介绍.进而介绍深度强化学习的基本知识。然后分别介绍了强化学习(重点介绍蒙特卡洛算法和时序差分算法)和深度学习的基础知识、功能神经网络层、卷积神经网络(cnn)、以及深度强化学习的理论基础和当前主流的算法框架。最后介绍了深度强化学习在不同领域的几个应用实例。引例、基础知识和实例相结合.方便读者理解和学习《揭秘深度强化学习》内容丰富.讲解全面、语言描述通俗易懂.是深度强化学习算法入门的最佳选择。本书适合计算机专业本科相关学生、人工智能领域的研究人员以及所有对机器学习和人工智能算法感兴趣的人员书在版编目(cp)数据揭秘深度强化学习/彭伟编著.一北京:中guo水利水电出版社.2018.工智能技术丛书isbn978-7-51706238-71.①揭…ⅱ.①彭…ⅲ.①机器学习一研究ⅳv.①tp81中guo版本图书馆cip数据核字(2017)第327452号丛书名人工智能技术丛书秘深度强化学习 jiemi shendu qianghua xuexi出版发行中guo水利水电出版社(北京市海淀区玉渊潭南路1号d座100038)e-mail:[email protected]电话010)62572966-220522662201(营销中心)经售北京科水图书销售中心(零售电话010)88383994、63202643、68545874全guo各地新华书店和相关出版物销售网点排版北京智博尚书文化传媒有限公司河市龙大印装有限公司格170mm×30mm16开本2325印张357千字版次2018年5月第1版2018年5月第1次印刷印数000-5000价89.80元凡购买我社图书.加有缺頁、例頁、脱页的.本社营销中心负责调版权所有·侵权必究

前言深度强化学习( deep reinforcement learning.drl)是一种新兴的通用人工智能算法技术.是人工智能迈向智能决策的重要一步。关于深度强化学习的文章目前比较少.系统介绍深度强化学习的教材几乎没有。本书系统地介绍深度强化学习算法的基础知识。学习该算法的人员需要人工智能相关专业的背景.但是并不需要比较深的背景本书以一种通俗易懂的、细致的方式对深度强化学习算法进行了讲解.力求帮助读者较快入门。深度强化学习涉及的知识面比较广.但其算法原理并不是想象得那么复杂。因此.本书会对其相关知识点进行简要的介绍.保证没有相关经验的读者也能够很好地理解本书的内容。通过本书的学习.希望读者能够掌握两大类别的深度强化学习算法:基于动态规划的算法以及基于策略梯度的算法。深度强化学习具有较广泛的使用场景.例如游戏决策、量化投资、动画仿真等.希望本书能够帮助读者适应不同的使用场景本书特点沿的研究方向:本书介绍人工智能目前最前沿的研究方向.是通用智能的基础。完备的drl入门书籍:囊括经典.紧跟前沿.包括drl目前最新研究成果通俗易懂的讲解:用通俗易懂的语言.结合案例进行解析.适合所有人工智能相关专业的初学者.能帮助他们快速入门专业的经验:本书密切结合实际应用.是人工智能前沿研究及实践的经验总结

‖揭秘深度强化学习本书内容安排第1章深度强化学习概览本章从当前人工智能飞速发展并引起广泛关注的背景出发.概述了深度强化学习的基本知识.强化学习和深度学习的发展历史、基本概念和特点等.以及深度强化学习的两种算法2章强化学习基础传统的强化学习是深度强化学习的基础。本章从马尔科夫模型出发介绍了马尔科夫决策过程.同时用比较通俗的语言介绍了强化学习中的两种问题.有模型强化学习问题以及无模型强化学习问题。现实中无模型强化学习问题是一种非常普遍的情况.因此重点介绍了其中的蒙特卡洛算法以及时序差分算法。第3章深度学习基础强化学习引入深度学习之后.性能得到了极大的提高。本章重点介深度学习的基础.主要从四个方面来介绍:深度学习简史、深度学习的基础概念、数据预处理以及深度学习的硬件基础。本章的学习对于强化学习甚至是机器学习都非常重要第4章功能神经网络层功能神经网络层是深度学习的核心部分。本章将介绍深度学习过程中的激活函数、全连接层、参数开关 dropout以及cnn和rnn等。本章最也介绍了相关的网络设计技巧。第5章卷积神经网络【cnn本章用大量的篇幅介绍卷积神经网络.这是因为目前drl都是基于cnn实现的.是希望读者能够迅速掌握其相关知识.不要因为其难点而影响算法的学习。本章主要介绍了cnn的网络结构、基于cnn的经典模型.以及基于cnn的流行应用第6章循环神经网络(rnn循环神经网络虽然不是深度强化学习的重点.但是也是深度学习的个重要的网络结构.不难预见.基于rnn的强化学习算法也会不断出现。本章介绍了rnn的基础.同时介绍了rnn的两种常见的结构:lstm以及gru

#############################################

资源下载

下载价格VIP专享

仅限VIP下载升级VIP

犹豫不决让我们错失一次又一次机会！！！

原文链接：https://1111down.com/224393.html，转载请注明出处

电子书：《揭秘深度强化学习》_彭伟《揭秘深度强化学习》_彭伟

在线客服

升级VIP

全屏浏览

夜间模式

繁简切换

返回顶部

电子书：《揭秘深度强化学习》_彭伟《揭秘深度强化学习》_彭伟

在线客服

升级VIP

全屏浏览

夜间模式

繁简切换

返回顶部

社交账号快速登录

社交账号快速登录