Please enable JavaScript.
Coggle requires JavaScript to display documents.
學習的評量與發展 - Coggle Diagram
學習的評量與發展
評量的發展流程
決定評量目的
What do you evaluate for?
安置評量
以學生的能力或特質分班。
安置性決策
按照不同的能力或特質進行不同的教學模式。
診斷評量
特別關心持續性或是重複性的學習困難。
訂定補救教學計畫
形成評量
了解教學過程中的學習狀況,可以做為教學回饋。
找出學習難點提供作業加以練習。
總結評量
檢測學生是否達到教學目標的程度。
評量的依據要由教學目標做決定。
自我評量
引導學生找出適合自己的學習狀況,利用後設認知學習如何學習。
找出學習難點,利用引導加深或是重點式的學習破解學習迷思。
定義評量內容與技能
What do you evaluate for?
內容
情意
技能
確保
標準化測驗
常模參照測驗
根據分數在團體中的位置加以解釋,是一種相對性的標準比較,一般會以平均水準為參照點。
例如:智力測驗、國考。
標準參照測驗(效標參照測驗)
根據教學前事先所訂定的絕對性標準用以解釋測驗,來判定通過與否,不與他人做比較。
例如:各種語言檢定、駕照類考試。
選擇適當評量作業 (評量作業=題型)
How do you evaluate?
測驗雙向細目表
內容和技能的比重
教學目標內容和認知層次吻合程度
認知層次[Bloom's Taxonomy]
analyze
apply
evaluate
understand
create
remember
常見的作業題型
選擇反應題型
優點
計分便利
答題時間短
適用範圍廣泛
良好的題目設計能診斷學習錯誤
評量目標為知識。
缺點
學習會停留在辨識階段
學生不會花心力去再憶
是非題
適合確認事實陳述之正確性
適合區辨事實與意見
適合辨識因果
缺點
不易寫出確切為真或假的敘述
克漏(選擇)題型
配合題
測驗方式為前提和反應的應用
建構反應題
考生必須自己寫出答案
例如:申論題、實作表現、人際的互動關係
除選擇反應題之外都屬之
簡短建構反應題
目標
對知識的簡短理解
題型
填空
計算
簡答
適合範疇
專有名詞的知識
具體事實的知識、方法或程序的知識資料簡單解釋
缺點
計分困難
計分困難不適合測量複雜的學習成果
申論題型
學生作答回應的自由度高
以自己的方式建構、組織所要表達的想法。
若題目為比較題型,就只能應用低層次思考能力。
缺點
計分困難
評分費時
評分者難有高度的一致性
1 more item...
實作評量
含創造作品、建構答案或作品展示
根據學生的呈現及與評量
重視
與教學密切結合
學習發生於完成評量的過程
過程中提供的回饋與提示
幫助學生從多元的機會中學習
任務與真實生活貼合
學生能更主動學習
特點
可測出高層次的理解或能力
要求學生說明其答案
表現可直接觀察
是完成評量任務的重要概念
計分依賴專業的評分判斷且須有清楚的評量標準
事先訂定多元的評分標準
評量任務時往往無單一的正確答案
評量任務反映現實生活會遇到的狀況
評量實作二(人際溝通)
以提問的方式進行複習、討論、評量學生的學習狀況
提升學習成效
主要功能
讓學生專注於學習歷程
讓學生整理思緒、表達想法
有助於深化學習
藉由同儕間的不同解釋加以複習
教師可多次強調重要概念
可調整教學步調,反思理解
可是維持和經營的一種方式
提問類型
聚斂式問題
有唯一正解
發散式問題
提問建議
按照層次認知區分
2 more items...
發展與設計評量作業
考量
需測得學習成果
評量作業樣本需具備代表性
測驗題目代表性與否
避免與建構無關因素影響作業表現
考量評量作業對學習與教育的影響
編擬評量作業一般性建議
明訂認知層次、題型及題數分配
清楚定義評量作業‘確認評量要求表現與學習成果吻合
不要有暗示性的題目線索和答案
有標準和公認答案‘或評分者對表現的看法
題目宜改寫,不宜抄錄
預試、修改評量作業、實施評量
中
測驗的定位、分級方式、命題原則、命題注意事項等。
後
修改/審查試題、試題分析和預試
前
命題人選、命題人員的訓練、命題指標的安排。
評分與回饋
評分
評分量表
整體式量表
影響表現的所有標準組合
如:切題、結構組織、文章完整性、錯別字、格式與文法
優點
評分容易
缺點
回饋較少、學生表現無法完全吻合某個級分描述
分析式量表
每個標準表現分開評分
如:口頭報告
注意事項
標準描述具體
清楚定義每個標準的各項表現水準 (最好要有樣本)
與學習目標吻合
容易使用 (約5~8 項標準即可)
評分標準容易理解
回饋
What do you get from the evaluation?
提供明確可改善之處
適當規畫回饋時機(有時間進行修正)
指出學習進步之處
儘量給予立即性回饋
學習前學生清楚評分標準。評量後清楚指出達標狀況。
善用同儕回饋
信度 Reliability
再測信度
穩定性
內容一樣;同一測驗
缺點:受試者真值不確定
複本信度
等值性
複本延宕信度
不同時兩次評量
優點:可將 遺忘曲線 考量進去
複本立即信度
同時兩次評量
缺點:受試者負擔重
內容不一樣
內部一致信度
折半信度
將原有題目擴充為2倍,有一半的題目是重複或相似的
隨機誤差 e.g.外在環境變數
隨機誤差 e.g.外在環境變數
評分者信度
評分者
課前思考
評量的目標不同,對評量的方式有何不同?
每一種評量的目標都有其合適的評量方式。
例如:為了檢測口語能力,合適的方法可能為口試。
為什麼要有評量?
學習評量
評量的用途對設計、使用對有很大的影響。
例如:用途書寫的小考或複習,可以用遊戲的方法進行;但若是總結性評量可能就是筆試會比較恰當。
學習評量是目標導向的
例如:要能用對評量方式,才能準確檢測所設置的教學目標。
(課前、課後、平時考、期中期末考)
課堂宗旨: 《論語 為政》:「學而不思則罔;思而不學則殆」
四大評量種類
形成性評量
重視過程
總結性評量
成果展現
診斷性評量
安置、補救、調整教學
自我評量
省思、後設認知
公平性
Bias偏誤
學生對學習目標與評量有清楚認知
Popham兩種偏誤
冒犯 offensiveness
刻板印象
不公平懲罰 unfair penalization
效度
效度證據
雙向細目表
縱向:測驗的內容與形式;橫向:涵蓋能力
確保內容效度
效標
效標關聯效度
預測效標 Predictive Validity
非同時;測試經過一段時間-->取得受試者的在未來的表現
同時效標Concurrunt Validity
同時間:比較效標合測驗分數的一致性
回推效標 = 不確定/回應 效標正確性
構念效度
構念
Messik構念效度六層面
內容面
實質面
結構面
評分模式忠實反映構念的結構
類推面
外在面
幅合效度
區辨效度
後果面
後效作用
提升效度之作法
確保題目難度的適當性
確保受試者的環境,施測品質穩定
教師需要熟悉評量的方式
評量結果與評量目標的一致性
實用性
經濟作用
教師應評估四大因素
評量時間
容易度
評分
分數解釋
評量實施
評量方式的熟悉度
花費
說、寫(成本高) vs. 聽、讀(成本低)
大規模測驗
電腦化測驗