分类
联系方式
  1. 新浪微博
  2. E-mail

强化学习

目录

什么是强化学习,参见强化学习概述介绍。

概念:

奖励 序列决策 个体 环境 状态 马尔可夫属性
三大组成部分 策略 价值函数 模型

个体与环境的关系

推荐学习教材:

  • 《An Introduction to Reinforcement Learning, Sutton and Barto, 1998》
  • 《Algorithms for Reinforcement Learning, Szepesvari, 2009》
文章列表
  1. Bellman方程
  2. 《用Python动手学强化学习》学习笔记
  3. RL Baselines3 Zoo
  4. RL Baselines3 Zoo ExperimentManager