Please enable JavaScript.
Coggle requires JavaScript to display documents.
深度强化学习 (基于模型方法 (I2A, World Model, Value Iteration Network, VPN, MCTS),…
深度强化学习
基于模型方法
I2A
World Model
Value Iteration Network
VPN
MCTS
基于值函数
optimality tightening
PGQ
优先经验回放
Q-Prop
分层强化学习
SNN4HRL
MLSH
Option-Critic
FeUdal Network
传统方法
异步动态规划
Prioritized Sweeping
Dyna
主动探索
基于内在激励方法
Curiosity-Driven
Exemplar model
Count-based
Superised based
VIME
一致性探索
Bootstrapped DQN
NoisyNet
Parameter noise
复杂环境探索
Go-Explore
SIL
基于记忆模块
MFEC
NEC
Neural Map
辅助任务
UNREAL
Unsupervised tasks