Please enable JavaScript.
Coggle requires JavaScript to display documents.
REINFORCEMENT LEARNING - Coggle Diagram
REINFORCEMENT LEARNING
-
-
-
-
storia e stato
History
sequenza di obs,act, rew
-
-
CLASSICAL
Model Based
Prediction
DInamic Programming
- se conosco state transition function
- costosa
- uso informazione salvate per il prossimo risultato
-
Model Free
Prediction
Monte Carlo
- approssimo media in maniera empirica
- serve episodi con un termine
Temporal Difference
- non servono episodi a termine
- bootstrapping
-