七月在线july在线强化学习

七月在线july在线强化学习

资源下载
仅限VIP下载,请先
犹豫不决让我们错失一次又一次机会!!!

七月在线july在线强化学习

资源详情

七月在线_ 强化学习 [一举解开alphago zero的百胜奥秘]七月在线_ 强化学习 [一举解开alphago zero的百胜奥秘]课程简介强化学习.被誉为可能通向强人工智能的第三类机器学习方法.在ai游戏领域的应用已司空见惯.如自动玩flappy bird.借助强化学习玩星际争霸.最近非常火的王者荣耀也不例外;在无人驾驶、自动交易等领域也有着举足轻重的作用。《强化学习》课程.带你揭秘alphago和星际争霸/王者荣耀.华尔街最热门的自动交易算法背后的技术及无人驾驶的关键点。课程特色1)从模型无关到模型相关.从q-learning到policy gradient.全面涵盖主流强化学习内容知识2)与工业级ml算法紧密结合的应用案例讲解3)配套实验环境与gpu服务器第1课 强化学习rl简介知识点1:强化学习定义:可能通向强人工智能的第三类机器学习方法知识点2:强化学习数学模型:马尔科夫决策过程(mdp)知识点3:rl机器人:探索环境.规划自己的人生知识点4:强化学习基本算法分类知识点5:model-based rl: 已知环境.如何优化自己的人生第2课 model—free learning知识点1:环境未知.如何评估测略(状态价值)知识点2:蒙特卡洛方法学习状态价值函数知识点3:td方法学习状态价值函数实战项目:两种方法比较及代码实现知识点5:openai gym介绍第3课 model-free control知识点1:ϵ− 贪婪策略:平衡 exploration and exploitation知识点2:on/off-policy 蒙特卡洛方法知识点3:on/off-policy td 算法 (sara)实战项目:on/off-policy 算法比较及代码实现第4课 q-learning知识点1:q-learning知识点2:deep q-learning实战项目:q-learning解决山地车问题第5课 策略梯度学习知识点1:蒙特卡洛策略梯度知识点2:actor-critic算法实战项目:用policy gradient解决连续山地车的问题第6课 tensorflow强化学习应用案例实战项目:使用deep q network 和 policy gradient完成以下游戏:强化学习乒乓球游戏、强化学习flappy bird

七月在线_ 强化学习 [一举解开alphago zero的百胜奥秘]

资源下载
下载价格VIP专享
仅限VIP下载升级VIP
犹豫不决让我们错失一次又一次机会!!!
原文链接:https://1111down.com/177915.html,转载请注明出处

本站开启缓存功能

登入后回任何页面即可登入成功,当前页不显示

没有账号?注册  忘记密码?

社交账号快速登录