Maxiee Blog
关于我
RSS订阅
分类
联系方式
新浪微博
E-mail
强化学习
目录
什么是强化学习,参见
强化学习
概述介绍。
概念:
奖励
序列决策
个体
环境
状态
马尔可夫属性
三大组成部分
策略
价值函数
模型
个体与环境的关系
推荐学习教材:
《An Introduction to Reinforcement Learning, Sutton and Barto, 1998》
《Algorithms for Reinforcement Learning, Szepesvari, 2009》
文章列表
Bellman方程
《用Python动手学强化学习》学习笔记
RL Baselines3 Zoo
RL Baselines3 Zoo ExperimentManager