Please enable JavaScript.
Coggle requires JavaScript to display documents.
古典測驗理論(CTT) (基本假設 (定義複本測驗條件 (同一人在兩份測驗有相同的真實分數, 兩個測驗誤差彼此獨立,且誤差變異相等), ρe1e2…
古典測驗理論(CTT)
基本假設
ρe1e2 = 0:兩個不同測驗的誤差分數間無相關
ρe1t2 = 0:不同測驗的誤差分數與真實分數成零相關
ρte = 0 :誤差分數與真實分數間無關
E(X) = t :實得分數的期望值等於真實分數
X = t + e
定義複本測驗條件
同一人在兩份測驗有相同的真實分數
兩個測驗誤差彼此獨立,且誤差變異相等
測驗時間區分
形成性評量(formative)
精熟程度、學習歷程、學習進展
教學中(課中)
小考、性向測驗、S-P表、教師專業發戰評量、多元評量、開放教育
確認精熟程度與進步情形,難度低,以免累積學習困難
診斷性評量(diagnostic)
評量學習困難,以作為補救教學依據,診斷學習困難原因
治療、學習困難、學習錯誤、補救教學
教學中(課後)
預備性評量(preparative)
教學前實施
起點行為,學前評估,看學生程度
總結性評量(summative)
證明精熟教學目標或評鑑教學效果
畢業考試、高普考、期末考、學測、會考
教學後
針對教學目標達成程度與學生學習成果進行檢討
安置性評量(placement)
教學前實施
編班分組
測量量尺
次序變項(ordinal)
中位數有意義
考試名次、作文甲等乙等、中位數、百分等級、教育程度、社經地位
能指出大小次序,但無法衡量其距離差異大小
等距變項(interval)
相等單位,但無絕對零點,無倍數關係
平均數、標準差皆有意義
能指出大小次序,且能以數值方式表示差別之大小變數
溫度、明暗度、音量、智商、成績分數
類別變項(名義變項)(nominal)
僅眾數有意義
身分證號碼、血型、性別、教學方法、宗教信仰、價值觀
二變項具互斥性及完整性
比率變項(ratio)
具有絕對零點,有倍數關係
具備四則運算所有
能表示相對比例大小
身高、年齡、體重、薪資
優良教育測驗特徵
常模
解釋分數的依據
依據標準化樣本在測驗上實際表現成績而建立
平均數即是常模
功能
了解個體特徵
探討群體的趨勢
實用性
計分容易
解釋和應用容易
實施容易
經濟成本低
信度
效度
測驗倫理
道德原則
隱私權
知後同意
倫理原則
權益福祉
專業原則
社會原則
必須顧慮社會大眾所接納,必須盡量降低帶來潛在威脅與增進社會最大利益
簡介
最早發展的測驗理論
估計受試者測驗的實得分數與真實分數的關聯性
X = t + e
優缺點
優點
受試者:規定每位都要做答所有題目,評分標準以相同長度試題評論結果
分數:以原始分數衡量成就,或已衍生分數表示團體中相對位置
施測:流程限制少,且為直線性,作答程序先從簡單再做困難,回答可跳答且允許更改答案
物 + 地:推廣容易,應用容易,不需特別電腦程式
弱勢理論:淺顯易懂,假設較少
缺點
以相同測量標準誤為指標:無考慮能力,對高低能力極端值不公平
有意義比較僅有
相同測驗前後測的量數(重測信度)
複本測驗分數之間(複本信度)
考生能力估計:同一考生,難考題即能力不好,易考題則能力好
未考量受試者試題反應組型:原始分數相同者,能力未必相同
樣本依賴:同一份試題,放牛班覺得難,資優班覺得簡單
測驗功能區分
認知測驗
智力測驗
性向測驗
學術性向測驗
職業性向測驗
成就測驗
特殊成就測驗
診斷性測驗
綜合成就測驗
情意測驗
態度測驗
人格測驗
依測量分數解釋區分
常模參照測驗(NRT)
分數變異性高較佳
用途:分班編組(綜合性評量)→ 安置性評量、總結性評量
目的:競爭區辨學生程度高低 → 鑑別
學習範圍廣,每一範圍試題較少,強調鑑別力,最能區辨個別差異
根據分數在團體中位置來解釋,採用相對性標準比較
雙向細目表
信度高(相關係數)
內容效度、建構效度、校標關聯效度
百分等級、年級常模、標準分數
P=0.5,D高
標準參照測驗(CRT)
二分類數字(及格/不及格)、目標/內容參照分數
分數變異低較佳
絕對通過標準 → 效標
用途:補救教學(精熟性測量)- 形成性、診斷性、預備性評量
學習範圍窄,每一範圍試題較多,描述個體表現
信度低(百分比),不適合傳統統計方法
內容效度
依測驗時限(試題難易)區分
速度測驗(speed)
題目難度一致性低,時間限制嚴格,無人能在規定時間內完成
心理動作能力測驗、文書性向測驗
目的:測量受試者答題與反應速度的快慢
心理動作能力測驗:測量受試者個體意識支配的精細動作能力,專門測量速度、協調和運動反應等特性,例如:思特龍伯格敏捷測驗
難度測驗(power)
題目難度由易到難(增加受試者答題自信心),通常沒有時間限制
多數成就測驗均屬難度測驗,目的為評量學生獲得知識與技能的程度,而不是反應快慢
目的:測量受試者解決問題的能力
電腦適性測驗
依測驗反應型態區分
最大表現測驗
包括先天能力、實際能力與動機
智力測驗、學業性向測驗,國中基測、國小兒童自我概念量表
目的:測量受試者最佳反應,鼓勵受試者獲取最高分數或最大成就
性向測驗、成就測驗
典型表現測驗
命題方式:效標關鍵法、強迫選擇題、題目意義含糊
受試者可能會說謊或偽答,施行難度較高
受試者表現出的典型行為的反應資料,分數無好壞,沒有正確答案
人格測驗、興趣測驗、態度測驗、職業性向測驗、多元智能量表、適應測驗