Please enable JavaScript.
Coggle requires JavaScript to display documents.
學習評量的設計與發展 - Coggle Diagram
學習評量的設計與發展
.學習評量是目標導向的。
.評量的用途,對於評量的
(a) 設計
(b) 發展
(c) 使用
有決定性影響
一、決定評量目的
(1) 安置評量/測驗
.以學生能力等級、特質進行分組或分班
.安置性決策:讓能力相近的人組成小組,依興趣、能力、人格特質,安排的教學模式。
(2) 診斷評量
.關心持續性、重複性的學習困難
.使用標準化診斷測驗:以不同專業(教育、心理、醫學)找出影響學習的原因
.訂定補救教學計畫:
e.g. 閱讀障礙學生、學習者發音問題(語調、母音、子音錯誤)
(3) 形成評量
.以學生成功的學習予以增強
.找出學習難點和迷思 → 進一步提供作業
.瞭解教學過程中的學習狀況 → 作為教學回饋、教學成效
.評量形式:多元。e.g. 習作、教師自編評量、學習單、課堂提問、練習、遊戲
(4) 總結評量
.由教學目標決定評量成績的依據
.評量形式:成就測驗、期末考、口頭/書面報告、展演、畢業專題。
.學生達到教學目標的程度
(5) 自我評量
.後設認知:學習如何學習
.找出學習難點和迷思 → 引導加深/重點式學習
.引導學生了解自己的學習狀況
.評量形式:多元。
e.g. 習作、教師自編評量、學習單、課堂提問、遊戲
二、定義評量內容與技能
——What do you evaluate? 評量什麼?
(1) 內容:基本概念、意義
(2) 技能:實際的表達與操作(聽、說、讀、寫、互動)
(3) 情意:想法、情感、價值觀(跨文化)
.確保:評量確實涵蓋所有重要教學目標
三、選擇適當評量作業:題型
—— How do you evaluate? 如何評量?
(一)題型 VS. 評量的能力(知識、技能、認知層次)
(二)認知層次:布魯姆的認知領域 Bloom's Taxonomy
(4) Analyze 分析:牽涉分解材料成局部,指出局部之間與對整體結構的關聯。
包括:1.辨別。2.組織。3.歸因。
(5) Evaluate 評鑑:根據規準(criteria)和標準(standards)作判斷。
包括:1.檢查。2.評論。
(3) Apply 應用:牽涉使用程序(步驟)來執行作業或解決問題,與程序知識緊密結合。
包括:1.執行。2.實行。
(6) Create 創造:涉及將各個元素組裝在一起,形成一個完整且具功能的整體。
包括:1.產生。2.計畫。3.製作
(2) Understand 了解:從教學訊息中創造意義;建立所學新知識與舊經驗的連結。
包括:1.詮釋。2.舉例。3.分類。4.摘要。5.推論。6.比較。7.解釋。
(1) Remember 記憶:從長期記憶中提取相關知識。
包括:1.再認。2.回憶。
(三)題型:常見作業類型
(1) 選擇反應題型 (selected-response format)
.評量目標:知識
.最常見題型 → 一定要有選項
.優點:
(a) 計分便利客觀、答題時間短,測驗範疇廣泛,可提升內容取樣的代表性。
(b) 設計良好的題目能診斷學習錯誤。
.缺點:使學習深度停留在「辨識」而不花心力於「再憶」(recall)
.題型種類:選擇題、是非題、客漏選擇題型、配合題
(a) 選擇題
.聽讀技能可使用選擇題評測,但需要思考測驗目的,e.g. 分辨語音、選擇問句正確者。
(b) 是非題:
(i) 優點:確認事實陳述之正確性、區辨事實與意見、辨識因果。
(ii) 缺點:受猜測因素影響,且不容易寫出絕對真或假的敘述。
(c) 克漏選擇題型
(d) 配合題
(i) 分為兩個欄位:前提&反應
(ii) 應用高層次思考能力:大陸商務漢語考試
(2) 建構反應題(constructed-response format)
.定義:除反應選擇題以外,皆屬建構反應題型
→ 考生必須自己產生答案
.題型類型:簡短建構反應題、申論題型、實作表現、人際溝通(互動)
(a) 簡短建構反應題
4 more items...
1 more item...
1 more item...
1 more item...
四、發展與設計評量作業
(2) 評量作業樣本(內容)應具代表性
.建立「雙向細目表」,確保評量取樣具代表性。
.Linn & Gronlund:每個單元/構念評量,至少5-10題。
.測驗結果是否有效,關鍵在於測驗題目是否具代表性。
.題數越少,「建構反應題型」應越多。
(3) 避免與建構無關因素影響評量作業的表現
(1) 評量作業必須測量學習成果
(4) 考量評量作業對學習與教學之影響
後效作用:Washback 後果效度
.關心使用評量所產的所有後果,含預期/非預期,負面/正面。
e.g. 語言測試的引入對教師與學生的影響 → 抑制或促進語言學習。
(5) 編擬評量作業一般性建議
.清楚定義評量作業,確認評量要求表現與學習成果吻合。
.不要有暗示性的題線索和答案。
.明訂認知層次、題型、題數分配:雙向細目表。
.有標準和公認答案,或評分者對表現有一致看法。
.題目宜改寫,不直接抄錄。
五、預試
編製試題、命題工作考慮過程
中:測驗定位、分級方式、命題原則、命題注意事項。
後:修改/審查試題、試題分析、預試。
.前:命題人選、命題人員訓練、命題指標安排。
八、評分與回饋
A. 評量尺規
.申論題和實作評量 → 事先設定評分規準,以進行評分。
.評分表:
(1) 找出重要向度和標準(Criterion)
(2) 根據向度區隔不同的表現水準,給予清楚定義。
.注意事項:
(1) 評分標準容易理解
(2) 與學習目標吻合
(4) 清楚定義每個標準的各項表現水準(最好要有樣本)
(3) 標準描述具體
(5) 容易使用,約5~8項標準
.類型:
(1) 整體式量表(Holistic scale)
.優點:評分容易
e.g. 是否「切題」、「結構組織(完整度)」、「文章整體性」、「錯別字、格式與文法」
.缺點:回饋較少,學生表現無法完全吻合級分描述
.影響表現的所有標準組合 → 列出所有達標項目
e.g. 英文作文評分表準
(2) 分析式量表(Analytic scale)
e.g. 口頭表報 → 評分標準如:內容、組織、表達、語言運用。
.每個標準可分數個表現水準(需清楚定義)
.每個標準表現分開評分
e.g. 大學學測英文作文分析式量表
B. 回饋要點
——What do you get from the evaluation? 善用評量中所獲訊息
(3) 提供明確可改善之處
(4) 適當規劃回饋時間(讓學生有時間進行修正)
(2) 指出學習進步之處
(5) 盡量給予立即性回饋
(1) 學習前學生清楚評分標準,評量後清楚指出達標狀況
(6) 善用同儕回饋 → 讓學生練習說出作品優缺點,提供彼此建議性回饋。
六、修改評量作業
七、實施評量