你将学到的
  • 强化学习概念
  • Sarsa 强化学习算法
  • OpenAI Gym 应用
  • Q-Learning 强化学习算法
  • 策略梯度算法
lab-classic 实验 1 强化学习介绍与示例

知识点: 1.强化学习介绍 2.强化学习算法分类 3.强化学习应用 4.课外内容推荐

lab-classic 实验 2 Q-Learning 强化学习方法实现

知识点: 1.QTable的概念 2.QLearning算法实现 3.Sarsa学习算法 4.Sarsa和QLearning区别

lab-challenge 挑战 1 实现 Sarsa 学习算法走出迷宫

知识点: 1.QTable初始化 2.QTable更新函数 3.Sarsa完整算法实现

lab-classic 实验 3 OpenAI Gym 环境介绍及使用

知识点: 1.Gym环境安装 2.Gym环境使用 3.Gym环境示例

lab-challenge 挑战 2 Gym 玩 Atari 打砖块游戏

知识点: 1.OpenAIGym使用 2.打砖块游戏可视化

lab-classic 实验 4 策略梯度强化学习方法实现

知识点: 1.策略梯度过程推导 2.策略梯度定理 3.蒙特卡洛策略梯度算法 4.ActorCritic策略梯度算法 5.策略梯度算法实现

lab-challenge 挑战 3 使用策略梯度训练 CartPole

知识点: 1.策略梯度 2.策略梯度定理 3.MonteCarlo策略梯度算法 4.ActorCritic策略梯度

课程介绍

机器学习通常被划分为 4 个大分支,分别是:监督学习、非监督学习、半监督学习以及强化学习。本次课程中,我们将对强化学习的概念进行介绍并完成算法应用实践。

强化学习(英语:Reinforcement learning)是非常前沿的学科,它可能是实现强(类)人工智能的手段之一。了解并掌握基础的强化学习方法,将使得你对人工智能的概念进一步深化。

先学知识

课程难度

由于课程涉及内容难度较高,需要你已具备一定的机器学习实践能力。

适合人群

本课程主要面向已掌握机器学习监督学习和非监督学习方法,想要了解并学习基础强化学习理论知识的用户。

课程信息

  • 学习周期:课程有效期 2 个月, 2 个月后实验文档一直可以看,但无法进行在线实验。高级会员有效期内可一直学习,高级会员到期后课程失效(不能看文档)。
  • 课程价格:当前优惠价 129 元。
  • 企业团报:可获得更多支持服务,请点击购买咨询
课程教师

huhuhang 共发布过 47 门课程

查看老师的所有课程 >
实验楼楼+
实验楼会员