Please enable JavaScript.
Coggle requires JavaScript to display documents.
Verstärkungslernen und belohnungsbasiertes Entscheiden I (Dopamin und…
-
Rescorla - Wagner:
\(
\eqalign{
\lambda_t = r_t - V_t \cr
V_{t+1} = V_t + \alpha \cdot \lambda_t
}
\)
Lernrate \(\alpha\) bestimmt, wie aktuelle Schätzung von \(V_t\) durch kürzliche vs länger zurückliegende Ergebnisse beeinflusst wird:
- \(\alpha\) hoch: Verhalten fast nur unter Kontrolle der letzten Durchgänge, länger Zurückliegendes hat kaum Einfluss (ACC Läsion)
- \(\alpha\) niedrig: Letzte Durchgänge haben nur wenig Einfluss, länger Zurückliegendes wird nur langsam „vergessen“
-