Oliver xu's Blog
首页
关于
标签
归档
ALBUM
首页
关于
标签
归档
ALBUM
45
标签
42
分类
94
文章
Reinforcement Learning
2023
1
论文阅读20230613
2021
1
重要性采样及KL散度分析与不同实现方法
2020
7
PPO算法公式推导
使用PPO设计线性系统控制器
检查强化学习自定义环境是否符合Gym的API
强化学习之动态规划
PGADP数据驱动的优化控制
PolicyGradient公式推导
使用强化学习求解鲁棒控制器
2019
1
Playing Cartpole with natural deep reinforcement learning
1
2