Please enable JavaScript.
Coggle requires JavaScript to display documents.
HTA 9 - Lerntheorie 3: Operante/Instrumentelle Konditionierung - Coggle…
HTA 9 - Lerntheorie 3: Operante/Instrumentelle Konditionierung
Geschichte
1930: Veröffentlichung eines Artikels von B.F. Skinner.
Studie, Versuche mit Ratten (Hinter einer Schwingtür war Futter, graphische Darstellung der Versuche)
Skinnerbox
Kleinschrittiger Aufbau. Am Ende: Betätigung eines Hebel, hat Futterspender aktiviert
"An experiment on the rate of formation of a conditioned reflex"
Eigentlich war Skinner klar, dass das Verhalten nicht so wie bei Pawlow beschrieben werden kann.
Um welchen Reflex sollte es sich da handeln? Wo ist CR und CS?
1935 Lösung
Typ S: Stimulus - Futter
Typ R (Response): Verhalten - Futter
Operante Kon und das Gesetz der Wirkung (Law of effect)
Skinner und Thorndike
Unterschiedliche Tierarten, unterschiedlicher Versuchsaufbau, Versuchsapparat
In beiden Fällen Manipulation der Umwelt sowie Futter kontingent zur Manipulation
Law of effect war eine Art Vorstufe der operanten Konditionierung
Klassische Kon. vs Instrumentelle Kon.
Das Verhalten wird ausgelöst vs Das Verhalten tritt alleine auf
Ein Signal wird durch ein anderes ersetz vs Es wird kein Signal ersetzt
Bildung eines neuen Reflexes vs Stärkung eines Reflexes, der schon länger im Repertoire ist
Bereitet das Tier auf die Umgebung vor (Reaktion manipuliert nicht die Umgebung) vs Das Verhalten provoziert den Verstärker (Es "operiert" in der Umgebung)
Wird im Allgemeinen vom autonomen NS gesteuert vs Wird vom willkürlichen NS gesteuert
Wird gemessen in Latency und Stärke vs Wird gemessen in Frequenz, manchmal in Latency
Zweigliedrige Kontingenz (Reiz -> Reaktion) vs Dreigliedrige Kontingenz (Stimulus(diskriminativer Reiz) : Verhalten(operante Reaktion) -> Verstärker)
Doppelpunkt bedeutet Möglichkeit geben, Pfeil bedeutet Auslösen
Es gibt keinen Verstärker vs Der Verstärker ist das Entscheidende
Gemeinsamkeiten
Löschung, Spontanerholung, Diskrimination, Generalisierung
Operante Konditionierung
Verhalten wird spontan gezeigt und nicht ausgelöst
Das bedeutet nicht, dass es keinen Bezug zur Umwelt und Reizen gibt (Skinner hat das "kleine s" mit angegeben)
Es wird schnell mit Stimuli verknüpft
Das Tier führt Verhalten nicht ohne Reiz aus
Aber Stimuli sind keine Auslöser
Stimuli machen das Verhalten wahrscheinlicher (diskriminative=unterscheidende Stimuli)
Wichtigsten Prinzipien: Stimulation, Verstärkung, Löschen, Strafe, Generalisierung
Zwei Motivationen: Maximieren positiver Konsequenzen, minimieren negativer Konsequenzen.
Man kann nur am Verhalten feststellen, ob ein Verstärker oder eine Strafe vorliegt oder nicht.
Verstärker machen das Auftreten eines Verhaltens wahrscheinlicher und Strafen machen es unwahrscheinlicher.
4 Möglichkeiten: Positive und negative Verstärkung sowie positive und negative Strafe.
Verstärkung (Verhalten wird mehr): Positiv (es wird etwas schönes hinzugefügt), negativ (es wird etwas unangenehmes weg genommen)
Strafe (Verhalten wird weniger): Positiv (es wird etwas negatives hinzugefügt), negativ (es wird etwas schönes weg genommen)
Stimulation
Verhalten ist gesetzmäßig (sonst wäre Training nicht möglich). So kann es Training auf wissenschaftlicher Grundlage geben.
Ändert ein Tier sein Verhalten nicht in Anwesenheit eines Stimulus, dann nimmt es vielleicht den Stimulus oder den Verstärker/ die Strafe als Stimulus nicht wahr.
Biologische Basis: Tiere die einen bestimmten Verstärker voraussagen können, haben einen großen Vorteil gegenüber denen, die es nicht können.
Beispiele: Jägertier vs Beutetier (Was ist das Signal zum loslaufen/wegspringen/wegfliegen/...?)
Ein Stimulus ist jedes Ereignis in der Umgebung, das in der Lage ist Verhalten zu beeinflussen.
Tiere sind dazu gemacht auf Stimuli (Reize) zu reagieren.
Diskriminativer Stimulus = S(D): Wenn ein Reiz da ist, lohnt sich ein bestimmtes Verhalten. Wenn nicht, dann nicht. (Reiz anwesend: Verhalten verstärkt, Reiz abwesend: Verhalten nicht verstärkt)
Verstärker
Jeder Stimulus oder jede Aktivität, die ein bestimmtes Verhalten verstärken ist ein Verstärker
Positive Verstärker
Mögliche Verstärker: Futter (auch schon der Geruch oder Anblick der Futtertasche), die Arbeit/ Aufgabe, Signal welches über pos. Verstärkung trainiert wurde, Spiel, Zuneigung (Streicheln, Loben,...),...
Einfache Aufgaben können mit sehr guten Belohnungen beschleunigt werden, komplexe wiederum verlangsamt (kann den "Denkprozess" stören).
Große Futtermengen erhöhen den Arbeitseifer, Verhalten wird aber leichter gelöscht (wenn es diese großen Futtermengen oder dieses hochwertige Futter irgendwann nicht mehr gibt).
Positive Verstärkung: S(D) : R -> S(R+)
Gefühl: Freude
Von Tier zu Tier (von Hund zu Hund) verschieden.
Negative Verstärker
Negative Verstärkung: S(D) : R -> S(R-)
Problematik: Ich muss den negativen Stimulus ja erst mal hinzufügen, bevor ich ihn wegnehmen kann. D.h. das Verhalten, das direkt vor dem Hinzufügen gezeigt wird, wird bestraft.
Gefühl: Erleichterung
Nicht alle Verhalten sind gleich leicht mit Verstärkern zu konditionieren.
Nicht nur der Trainer gibt Verstärker.
Primärer Verstärker: Alles was ein Verhalten erhält oder verstärkt, das nicht von der Verknüpfung mit anderen Verstärkern abhängig ist (Futter, Wasser, Sex, Unterschlupf)
Sekundärer Verstärker: Ein erlerntes Signal, das den primären Verstärker ankündigt (muss mit primärem Verstärker verknüpft sein um funktionieren zu können). Z.b. Markerwort/ Lobwort, Clicker
Strafe
Positive Strafe
S(D) : R -> S(P+)
Gefühl: Angst
Strafen werden sehr schnell generalisiert!!!
Negative Strafe
S(D) : R -> S(P-)
Gefühl: Frust
Aversiva
Alles wovor ein Tier flieht, oder was es vermeiden will.
Sind in der Natur allgegenwärtig.
Schmerzen, Hitze, Kälte, Nässe,...
Strafen
Alles was, wenn es kontingent zu einem bestimmten Verhalten auftritt, dieses Verhalten weniger werden lässt.
Man erkennt, dass etwas eine Strafe ist, an der künftigen Stärke des Verhaltens, dem es voraus geht.
Strafen werden von dem individuellen Lebewesen definiert.
Können primär oder sekundär (konditioniert) sein. Z.B. Nein/Aus/Pfui, Zischen, bestimmter Ort, bestimmte Tonlage, bestimmte Bewegung,...
Damit eine Strafe funktioniert müssen folgende Punkte erfüllt sein: Timing, Kontingenz, Stärke der Strafe.
Achtung! Was verknüpft das Tier? Aufmerksamkeit kann ein Verstärker sein. Unregelmäßige Strafe kommt einer intermittierenden Belohnung gleich und verstärkt wieder das Verhalten. Man bestraft ein Verhalten und nicht das Tier.
Tierschutzgesetz: Man darf einem Tier nicht ohne vernünftigen Grund Schmerzen, Leiden oder Schäden zufügen.
Löschen
Der Prozess bei dem ein zuvor verstärktes Verhalten in seiner Stärke abnimmt, weil alle Verstärker von diesem Verhalten eliminiert wurden.
Ein Verhalten das sich nicht länger lohnt, wird gelöscht.
Löschen ist nicht das Gegenteil von lernen. Es ist aktives lernen, dass ein S(D) nicht länger einen S(R+/R-) vorraussagt.
Tiere lernen auf ein Signal nicht länger zu reagieren, weil es nicht mehr die erwartete Konsequenz hat.
Verhalten, das im Vorfeld intermittierend belohnt wurde ist resistenter gegen löschen.
Lösungsmöglichkeit: Erst mal auf regelmäßige Belohnung umstellen und dann löschen.
Verhalten das regelmäßig belohnt wurde, wird leichter gelöscht.
Löschungstrotz: Ein Verhalten das gelöscht wird, wird erst häufiger und intensiver auftreten. Dann nimmt das Verhalten nach und nach ab, bis es ganz gelöscht wird.
Wichtig für den Kunden zu wissen. Falls nämlich beim Löschungstrotz plötzlich doch wieder belohnt wird, hat man intermittierend sowie verstärktes Verhalten belohnt. Es wird also noch schlimmer.
Spontane Erholung: Ein Verhalten, das schon gelöscht erscheint, tritt nach einer Pause wieder in gewohnter Intensität auf.
Das löschen geht dann schneller.
Das Verhalten wird immer mal wieder, aber immer schwächer auftreten.
Verhalten wird im Löschungsprozess variabler.
Generalisierung
Reaktionsgeneralisierung/ Verhaltensgeneralisierung: Unter identischen Auslösebedingungen zeigen sich ähnliche, aber nicht identische Reaktionsweisen.
Ein Tier zeigt ein bestimmtes Verhalten und kann dieses dann auch abwandeln und auf verschiedene Art und Weise zeigen, wenn ich nicht genau das belohne was ich möchte.
Wenn ein Verhalten ganz bestimmt aussehen soll, muss auf Diskrimination hingearbeitet werden.
Verhalten kann sich auch ändern. Es ist variabel.
Reizgeneralisierung: Die Reaktion eines Tieres auf einen Reiz, die in genau gleicher Weise erfolgt, wie die zuvor erlernte Reaktion auf einen anderen, ähnlichen Reiz (Z.B. Egal wer das Signal gibt, das Verhalten wird ausgeführt.
Tiere lernen kontextspezifisch. Die Generalisierung ist ein wichtiger Punkt im Training.