Please enable JavaScript.

Coggle requires JavaScript to display documents.

四、學習 (參、操作制約 operant conditioning (一、操作制約的先聲－Thorndike的嘗試錯誤學習 (二、B.F.…

- - - - (一) 相關術語
        
        操作制約箱(operant chamber)
        
        觀察受試者特定行為和環境回饋間的關係的裝置，也稱為skinner box。
        
        操作行為(operant behavior)
        
        受試者主動與環境產生互動，而受環境回饋結果影響的行為。
        
        增強(reinforcement)、增強物(reinforcer)
        
        正增強、負增強
        
        增強：個體在環境中操作，環境回饋的結果使得個體特定操作行為次數增加的程序。
        
        增強物：在特定行為出現後隨之呈現，造成個體特定操作行為次數增加之事物。
        
        處罰(punishment)、處罰物(punisher)
        
        積極處罰、消極處罰
        
        處罰：個體在環境中操作，環境回饋的結果使得個體特定操作行為次數減少的程序。
        
        處罰物：在特定行為出現後隨之呈現，造成個體特定操作行為次數減少之事物。
        
        (二) 聯結之學習
        
        古典制約：CS+UCS有關。
        
        操作制約：操作行為和附隨結果或後效(contingent consequence)的關聯。
        
        (三) 操作制約的程序－以「正增強」為例
        
        確認受試者學習的操作行為
        
        選擇適合的增強物
        
        進入skinner box前，先將增強物之事物進行剝奪，例如：先餓肚子24小時。
        
        建立行為基線(baseline)：先觀察未受增強之前，操作行為在單位時間內的出現次數，基線水準(baseline level)。
        
        開始對操作行為進行增強，並記錄操作行為的變化情形。
        
        停止對操作行為增強，紀錄操作行為的變化情形。
      - 三、操作制約的基本現象
        
        (一) 消弱(extinction)與消弱陡增(extinction burst)
        
        消弱：操作制約建立後，個體呈現操作行為不再提供增強物，則該操作行為會逐漸消失，直至不再反應。
        
        消弱陡增：消弱初期，個體的操作行為會大量出現。
        
        (二) 自發恢復(spontaneous recovery)
        
        當個體的操作行為消弱之後，隔一段時間，重新放置到先前的制約環境中，原本被消弱的操作行為會自發性地出現，不需重新經歷制約歷程。
        
        (三) 刺激類化(stimulus generalization)
        個體經增強而對某特定刺激進行操作行為後，類似該特定刺激的其他新刺激，不需經歷操作制約的歷程，能直接對新刺激進行反應。且新刺激與原刺激越相似，引發操作行為次數越多。
        (四) 刺激區辨(stimulus discrimination)
        個體經增強而對某特定刺激進行操作行為後，經辨別訓練，可學會僅對特定刺激反應，而不對其他刺激反應。
  - - - Wolfgang Kohler(1920)猩猩multiple stick problem 實驗。
        
        突然了解環境眾多刺激的彼此關聯，從而採取一有效的行動。
      - 二、與表徵使用有關
        representation
        
        (一) 方位實驗(place learning)
        
        Tolman & Honzik飢餓老鼠跑迷宮實驗
        
        老鼠知道迷宮布局，認為老鼠心裡有一個迷宮的圖像表徵，稱為認知地圖(cognitive map)。
        
        (二) 潛在學習(latent learning)
        
        Tolman & Honzik 三群老鼠跑迷宮
        
        操弄酬賞的方式，觀察老鼠跑錯迷宮的次數
        
        結論：發現老鼠已有了學習，但因外在環境誘因不足，而無法顯現、無法從外顯行為觀察到的現象，稱為潛在學習(latent learning)。.
        
        (三) 八爪迷宮(radial arm maze)
        
        研究老鼠空間記憶能力
        
        三、解釋過去經驗
        
        (一) 習得無助(learned helplessness)
        
        Martin Seligman & Maier(1967) 使不同組別的小狗經歷能or不能控制的負面事件，看不同組別的小狗在後來類似的負面事件中的學習表現是否不同。
        
        結論：個體對負面事件的解釋而非負面事件本身，對個體未來的學習造成影響。
        
        習得無助係指個體發生無可控制或無法避免的負面情境，在未來類似的負面情境中放棄反應的一種學習現象。
        
        (二) 解釋風格(explanatory)或
        歸因風格(attributional style)
        
        Seligman認為人們會對發生在自己身上的事件進行解釋(歸因)，解釋的結果會影響其行為和情緒，且每個人在解釋事情時有基本穩定的傾向，就是解釋風格。共有3個方面，可形成悲觀或樂觀歸因。
        
        普遍性(pervasiveness)：把原因歸於特定、小範圍；或是普遍(global)、大範圍。
        
        穩定性(stability)：相信事情是短暫的；或是持續較久的。
        
        個別性(personality)：事情的原因是自己造成的；或是環境造成的。
        
        四、觀察學習
        (observational learning)
        
        (一) 指個體通過觀察他人而進行學習的歷程。
        (二) 社會學習論(social learning theory)
        
        Albert Bandura - Bobo doll experiment(1965)
        
        觀點：
        
        人的學習過於廣泛不可能事事從親身經驗而增強習得。
        
        所有可透過直接經驗習得的行為，皆可透過間接經驗習得。即觀察他人行為受環境回饋的結果是個體的學習來源。
        
        替代增強(vicarious reinforcement)：楷模一項行為受到獎勵，則觀察者日後出現此一行為機會增高。
        
        替代處罰(vicarious punishment)：楷模一項行為受到處罰，則觀察者日後出現此一行為機會減少。
        
        觀察學習(observational learning)或替代學習(vicarious learning)：個體透過觀察他人行為的結果，從而產生的學習。
        
        Bandura認為學習也可以是內在的變化，比如：偏好、態度、信念、預期等。當這些變化發生不一定立刻造成行為改變，但若環境提供適當誘因，這些內在變化才會轉變成可觀察的行為。
        
        觀察學習形成的過程
        
        注意(attention)：注意到楷模的行為。
        
        保留(retention)：記住楷模的行為。
        
        再生(reproduce)：觀察者成功重新表現出記住的楷模行為。
        
        動機(motivation)：情境中有誘因使觀察者表現出楷模行為。(預期酬賞)
        
        (三) 觀察學習的神經基礎－鏡像神經元(mirror neuron)
        
        由Rizzolatti等人發現，存於額葉的前運動皮質(premotor cortex)。是個體在從事某行為或看到、聽到別人從事某行為都會firing的神經元，就好像鏡子一樣自動反應外在事件。
        
        鏡像神經元與觀察學習
        
        使用TMS穿顱磁刺激干擾觀察者的運動前皮質，則他後續的觀察學習結果會較差。故觀察學習涉及鏡像神經元的運用。
        
        鏡像神經元對社會認知的重要性
        
        心理學家認為鏡像神經元是人類認會認知的生理基礎。(在人際互動中理解他人意圖、知覺、感受的能力，溝通、模仿、合作等社會行為)
        
        自閉症兒童無法了解他人意圖與情感，亦即心智論(theory of mind)能力不彰。Ramachandran發現自閉症兒童的鏡像神經元功能有缺陷，為破鏡理論(broken mirror theory)
        
        (四) 收看暴力影視會導致暴力行為?
        
        研究結果：收視暴力影視較多者，長大自評及他人評價的暴力程度越高，呈正相關。有關聯但不代表有因果。
- - - - (二) 聯結學習(associative learning)
        
        將一事物與另一事物產生聯繫的學習。
        
        行為學派的核心理論
        
        古典制約(classical conditioning)
        
        操作制約(operant conditioning)
        
        (三) 認知學習(cognitive model of learning)
        
        個體通過思考，以了解事物的意義、關聯或價值，從而造成信念或知識上的長久改變。
- - - - (四) 刺激區辨(stimulus discrimination)
        
        若經辨別練習，只在特定的CS後呈現UCS，個體可學會只對特定刺激進行反應，類化梯度會消失。
        
        (五) 高層制約(higher-order conditioning)
        
        當一個制約刺激已能穩定引發制約反應，此制約刺激本身可以做為一個非制約刺激，當作其他制約刺激形成的媒介。
        
        越高層制約刺激所引發的制約反應越小；通常第四層以上難以形成。
        
        BOX：合欲制約&嫌惡制約
        
        合欲制約(appetitive conditioning)：CS伴隨個體喜歡的UCS，例如：鈴聲+食物。
        
        嫌惡制約(aversive conditioning)：CS伴隨個體厭惡的UCS，例如：鈴聲+電擊。
- - - - BOX：處罰(punishment)
        一、定義：使行為發生次數減少的行為程序。當特定操作行為出現後，伴隨嫌惡事務的呈現或可欲事務的移除，使個體習得操作行為與附隨結果的關聯，藉以減少該行為出現的次數。
        
        處罰的意義：是一個「有效」的措施。
        
        操作行為經驗到負面結果，使行為減少。
        
        處罰不是負增強。
        
        二、分類：
        (一) 積極處罰(positive punishment)、施予式處罰：個體從事一操作行為後，對其施予嫌惡事物，使個體後來從事同一行為次數減少。
        (二) 消極處罰(negative punishment)、剝奪式處罰：個體從事一操作行為後，對其移除可欲事物，使個體後來從事同一行為次數減少。
        三、有效處罰的要素
        (一) 強度夠：強度越大，持續效果越久，若逐次提高強度會建立耐受性。
        (二) 不當行為和處罰須具備接近性。
        (三) 連續處罰比間歇處罰有效(跟增強相反)。
        四、處罰的作用與缺點
        
        處罰使被處罰者經歷到負面情緒。
        
        處罰也有刺激區辨，個體能了解有時候出現不當行為也不會面臨處罰。
        
        對處罰有關的事情進行類化，例如：被處罰而不喜歡學校。
        
        處罰只是讓被處罰者知道什麼事不能做，在學習意義上較消極。
        
        處罰，有時是一種攻擊行為的示範。
        
        五、操作制約的先天傾向
        (一) 本能性的漂移(走鐘)(instinctual drift)
        
        由Keller Brenland & Marian Breland提出。
        
        經增強而習得的行為發生變化，此變化會朝向某個相似的本能行為。
        (二) 結論：
        
        操作制約中，操作行為與附隨結果的關係若與本能行為越接近，則此行為越容易通過操作制約形成。
        
        個體在操作制約的習得和保留皆受生物本能的影響。
        
        六、操作制約的其他要點或應用
        (一) 迷信行為(superstitious behavior)
        
        迷信行為是操作行為和隨機可能發生的附隨效果形成聯繫的結果。
        (二) 塑成(逐步養成，shaping)
        
        將目標行為分割成若干的細目，再逐次達到目標行為。透過連續漸進的方式，一面增強後續的操作行為，一面消弱先前的操作行為直到目標行為出現。
        (三) 連鎖(chaining)
        
        目標較複雜、須由一連串累加動作才能完成時，將目標行為分解成若干個反應，再依次、逐步增強各個反應，使之連貫成一完整的行為目標。依連鎖的方向，可區分為：
        
        反向連鎖(backward chaining)
        
        正向連鎖(forward chaining)
        
        (四) 剝奪(deprivation)和饜足(satiation)
        
        剝奪：在進行正增強之前，使個體長時間不接觸增強物，使個體處於對增強物的渴望狀態。
        
        饜足：使個體暴露於過量的增強物中，使增強物不再具有增強效用。
        
        (五) 普力麥克原則(Premack principle)
        
        1959年有David Premack提出，係指個體偏好程度高的活動可以做為偏好程度低的活動之增強物。意即先要求從事偏好低的活動，再以偏好高之活動增強。
        
        (六) 暫停法(timeout，隔離法)
        
        消極處罰(剝奪式處罰)的運用。要求短暫離開正增強物的刺激情境。
        
        (七) 反應代價(response cost，反應犧牲)
        
        消極處罰(剝奪式處罰)的運用。移除一個可量化的可欲事物，減少個體重複發生不當行為。
        
        (八) 代幣制度(token economy)
        
        次級增強的運用，經古典制約學習，代幣取得初級增強物的獎勵性質，成了次級增強物。
        
        (九) 過度校正(overcorrection)
        
        施予式處罰的運用。個體出現不當行為後，要求他從事後續復原行為遠遠超過不當行為帶來的損害。