Please enable JavaScript.
Coggle requires JavaScript to display documents.
學習評量的設計與評量 - Coggle Diagram
學習評量的設計與評量
陸、流程
四、發展與設計評量作業
五、預試
三、選擇適當評量作業
六、修改評量作業
二、定義評量內容與技能
七、實施評量
一、決定評量目的
八、評分與回饋
肆、布魯納的認知歷程向度
三、應用
使用程序執行作業或解決問題
四、分析
分解材料成局部,並指出局部與整體間之關係
二、瞭解
從教學訊息中創造意義,建立新、舊知識之連結
五、評鑑
運用標準或規準做判斷
一、記憶
長期記憶中提取相關知識
六、創造
將各元素組裝成一具有意義、功能的整體
壹、目的
二、安置評量
1、以學生能力等級、特質進行分組或分班
2、安置性決策:能力相近的小組/依興趣、能力、人格特質,以安排不同的教學模式。
三、總結評量
2、評量成績的依據
3、由教學目標決定
1、學生達到教學目標的程度
4、評量形式:成就測驗、期末考、口頭或書面報告、展演、畢業專題等
一、診斷評量
2、使用標準化的診斷測驗,以不同專業(教育、心理、醫學)找出影響學習的原因
3、訂定補救教學計畫
4、如:閱讀障礙的學生、學習者的發音問題(語調、母音、子音錯誤)
1、關心持續性或重複性的學習困難
四、形成評量
1、了解教學過程中的學習狀況(做為教學回饋/教學成效)
2、能以學生成功的學習予以增強
3、找出學習的難點及迷思,進一步提供練習作業
4、評量形式:多元
5、如:習作、教師自編評量、學習單、課堂提問、練習、遊戲
五、自我評量
2、學習如何學習(後設認知)
3、找出學習的難點及迷思,引導加深/重點式學習
1、引導學生了解自己的學習狀況
4、評量形式: 多元/如:習作、教師自編評量、學習單、(課後)提問、遊戲
叄、方式
一、選擇反應題型
2、最常見題型
3、包含:選擇題、是非題、配合題、克漏(選擇)題型
1、selected-response format
4、評量目標:知識
5、優點:
(1)計分便利客觀、答題時間短、然測驗範疇廣泛,可提升內容取樣的代表性。
(2)設計良好的題目能診斷學習錯誤。
9、克漏(選擇)題型
6、缺點:
使學習深度停留在「辨識」,而不花心力於「再憶」(recall)
7、聽讀技能能透過選擇題評測嗎?
可以,但需思考測驗目的,如:分辨語音、選擇問句正確回答、段落/對話理解。
8、是非題:
(1)適合確認事實陳述之正確性、區辨事實與意見、辨識因果。
(2)缺點:受猜測因素影響,且不容易寫出絕對為真或為假的敘述。
10、配合題:
(1)分為二個欄位:前提&反應
(2)應用,如:大陸商務漢語考試
二、建構反應題型
2、題型: 填空題、計算題、簡答題
3、適合範疇 :專有名詞的知識、具體事實的知識、方法或程序的知識資料簡單解釋
1、目標: 對知識的簡單理解,適合使用簡短的建構反應題型
4、缺點: 計分較困難、不適合測量複雜的學習成果。
三、申論題型
3、如何評測高層次的思考、分析能力?
2、如:比較二語環境 VS. 外語環境 (只應用低層次思考能力:比較)
1、學生回應的自由度較高,以自己的方式建構、組織和表達想法。
4、缺點:
(1)計分困難
(2)評分費時
(3)評分者難有高度的一致性
五、實作評量
2、華語教學中,如:成功到傳統市場買到五斤的蘋果、成功殺價(錄影)
3、重視
(1)、與教學密切結合,學習發生於完成評量的過程
(2)、過程中提供回饋與提示幫助學生從多元的機會中學習
(3)、任務符合真實生活的情境與挑戰,使任務較具意義,學生更能主動學習
1、含創造作品、建構答案或作品展示,根據學生呈現能力給予評量
4、缺點
(1)、同申論題
(2)、教師投入的時間多
5、特點
(4)、完成評量任務(task)要用到重要的概念
(5)、計分依賴受過訓練的評分者之專業判斷(須有清楚的評量標準)
(3)、表現可直接觀察
(6)、事先訂定多元且公開的評分標準
(2)、要求學生為其答案提出解釋和辯護
(7)、通常評量任務並無單一的正確答案
(1)、可評量高層次的理解或能力
(8)、評量任務反映實實生活所需要面臨或解決的情境
四、課堂提問
1、以提問和互動的方式進行複習、討論、評量學生學習狀況(教學診斷和回饋),提升學習成效
2、主要功能:
(1)、讓學生集中注意力於學習歷程
(2)、讓學生整理思緒、表達想法,有助深化學習
(3)、讓其他同學再複習一次。(同儕解釋角度不一,或許更容易理解)
(4)、教師可再次強調重要的概念與想法
(5)、可調整教學步調,重新反思其理解;課室維持和經營的一種方式。
3、聚斂式問題(convergent question)
有唯一正解
4、發散式問題(divergent question)
(2)、涉及認知層次,分為
a、低層次(事實性訊息):誰、什麼、如何、何時、多少?
b、高層次(需透過思考的問題):解釋、預測、區分、比較、解決
(1)、多個適當的答案
柒、考量
三、避免與建構無關因素影響評量作業的表現
四、考量評量作業對學習與教學之影響
後效作用(後果效度)
二、評量作業樣本(內容)應具代表性
1、測驗結果是否有效,關鍵在於測驗題目是否具代表性
2、建雙向細目表的目的之一,確保評量取樣具代表性
3、Linn & Gronlund:每個單元/(構念)的評量,至少5-10題,愈少「建構反應題型」應愈多
五、編擬評量作業一般性建議
1、明訂認知層次、題型及題數分配(雙向細目表)
2、清楚定義評量作業,確認評量要求表現與學習成果吻合
一、評量作業必須能測學習成果
貳、定義
一、評量需包含
3、情意:想法、情感、態度及價值觀(跨文化)
2、技能:實際的表達與操作(聼說讀寫、互動)
1、内容:基本概念、意義
二、常模參照測驗
1、norm-referenced test
3、舉例:大學聯考、國家高普考試、月考、期末考、標準化成就測驗、智力測驗、性向 測驗。
2、指測驗結果,根據分數在團體中位置而加以解釋,採用相對性標準比較,一般以平均水準為參照點。
三、標準參照測驗
1、criterion-referenced test
2、根據教學前事先所訂定的絕對性標準用以解釋測驗。一般均以學生所學習知 識或技能,判定其「及格或不及格」、「精熟或不精熟」、「通過或不通過」,不須 參考他人表現來比較。
3、舉例:國家技師執照考試、汽車駕照考試、檢定考試(托福、英檢、日檢)等。
伍、評分量表
一、整體式量表
3、如:「切題」、 「結構組織(完整度) 」、 「文章整體性」、 「錯別字、格式與文法」
4、優點:評分容易
2、影響表現的所有標準組合 (列出所有的達標項目)
5、缺點: 回饋較少/學生表現無法完全吻合某個級分描述。
1、Holistic scale
二、分析式量表
1、Analytic scale
3、如: 口頭報告
(1)、評分標準可分四個項目: 內容、組織、表達、語言運用
(2)、每個標準可分數個表現水準(均需清楚的定義)。
2、每個標準表現分開評分
三、注意事項
3、標準描述具體
4、清楚定義每個標準的各項表現水準 (最好要有樣本)
2、與學習目標吻合
5、容易使用 (約5~8 項標準即可)
1、評分標準容易理解