信度、效度、難度、鑑別度
信度的意義與特性 🏴
意義
特性
指穩定性或一致性
相對程度上的差異而非全有或全無的差別
不是一種普遍的特質
是一種統計的概念,越高越好
求法
實得分數(X)=真正分數(T)+測量誤差(E)
測驗誤差愈小,實得分數就愈接近真正分數
信度指數
指實得分數與真實分數之間的相關
信度係數
以重測法、複本法、折半法、庫李法、評分者方法等得到的反應誤差的係數
信度的類型 🏴
再測信度 ✏
複本信度 ✏
用同一種測驗,對同一群受試者,前後測驗兩次,再依兩次分數計算相關係數
可表明測驗經過一段時間後的穩定性,故又稱穩定係數
可提供有關測驗結果是否隨時間而變異的資料
易受練習和記憶的影響,且兩次測驗情境無法完全相同
當同一種測驗有兩種以上的複本時,可以將兩種複本分別實施於同一群受試者,再依兩次分數計算相關係數
又稱等值係數
不受練習與記憶的影響,但編製不容易
折半信度 ✏
先依正常程序施測,並將全不試題依單雙分為相等兩半,並分別計算每位受試者在兩半測驗的得分,再依兩次分數計算相關係數
又稱內部一致性係數
有偏低之趨向,須以斯布公式加以校正
簡便易行,但受試者回答時易受影響,且只能表示兩半測驗的信度,無法提供時間穩定性的資料
庫李信度與α係數 ✏
一種分析測驗項目間的一致性以估計信度的方法
只需施測一次即可計算其信度係數
庫李信度僅可應用於以二分法(如是非題)為計分標準的測驗上
評分者信度 ✏
公式:2×相關係數÷1+相關係數
係指不同的評分者或同一個評分者於不同時間,在測驗過程中觀察、記錄、評分、計分等各方面相互間的一致性而言
使用在對於一些無法進行完全客觀記分的測量工具
測量標準誤 🏴
毎次測驗所得之分數與真實分數的差會形成常態分配,而此測量誤差分配之標準差即為測驗標準誤(SEM)
SEM(測量標準誤)=Sx(測量的標準差)√1-Rxx(測驗的信度係數)
影響信度的因素 🏴
測驗的長度(題數較多):題數越多,信度越高
受試者的變異性:受試者特質分布越廣,信度係數也越大
間隔時間的長短:兩次測驗時間相隔愈短,信度也愈高
測驗的難度:測驗試題的難度要適當,信度才會高
評分之客觀
信度之估計方法
效度的意義與特性 🏴
意義
即正確性或有效性
指測驗能測出其所測量的特質或功能的程度,效度越高,表示測驗的結果愈能顯現其所要測量的特性
特性
係指測驗結果正確性的程度
是相對的而非絕對的,是程度上的差別
是特殊的而非普遍的
測驗工具最重要的條件
效度的類型 🏴
內容效度 ✏
指測驗內容的代表性或取樣的適切性
利用雙向細目表以判斷測驗的內容效度
又稱課程效度或邏輯效度
成就測驗較重視內容效度
編製測驗後,請學者專家檢視,即在提高測驗內容效度,故又稱專家效度
效標關聯效度 ✏
係以測驗分數和效度標準之間的相關係數來表示測驗效度之高低
實用性最高的一種效度
又稱實徵效度或統計效度
可分為同時效度及預測效度
同時效度
預測效度
指測驗分數與當前效標資料之間的相關而言
亦產生效標混淆
指測驗分數與將來效標資料之間的相關而言
效標的特性有四:適切性、可靠性、客觀性、可用性
中間效標&終極效標
建構效度 ✏
常用效標資料包括專業訓練等
指一個測驗能測量理論的概念或特質的程度
旨在以心理學的概念來說明測驗分數的意義
常是一種心理測驗所採用的效度,尤其是人格測驗
是涵義最廣的效度
考驗建構效度的方法
內部一致性:旨在檢驗測驗內部之品質是否測量相同的心理特質
外在相關法
因素分析法
團體差異分析
發展的改變與實驗之介入
多項特質-多項方法分析(輻合性效度與辨別效度)
信度與效度的關係 🏴
信度是效度的必要條件而非充分條件
信度高,效度未必高
信度低,效度一定低
效度高,信度一定高
效度低,信度未必低
測驗的常模 🏴
發展性常模
年齡常模
體內常模
單位並不完全相等,且有隨年齡縮小的趨勢
年級常模
只能適用於發展中的兒童
適用於教育成就測驗,以表示學生在校學業成就的水準
且年級單位有表示生長之涵義;單位不相等
百分位數常模
標準分數常模
其他常模類型:全國性常模;地區性常模;學校常模;特殊團體常模;校(定)準常模
鑑別度分析 🏴
難度分析 🏴
常模參照測驗的難度分析方法
標準參照測驗的難度分析方法
另一種求法,將某一題高分組答對百分比加低分組答對百分比再除以二
等距尺度特性的難度指數:公式為△=13+4x
試題的難易度,係以全體受試者答對或通過該題百分比表示表示該題的難度
難度P值之特性
難度△值之特性
標準參照測驗的題目的難度,應和事先設定的通過標準一樣
難度接近0.50最為理想,此時鑑別力最高
P值越大,難度越低;P值越小,難度越高
P值無法指出各難度之間差異的大小
△值越小,難度越低;△值越大,難度越高(與P值相反)
可以指出不同難度之間的差異與數值
意義
指測驗試題能區分受試者優劣好壞作用的大小
常模參照測驗的鑑別度分析方法
內部一致性的分析
外在效度的分析
目地在於檢查個別試題與整個測驗的作用之一致性
公式: D=PH(高分組通過人數的百分比)-PL(低分組通過人數的百分比)
鑑別指數越大,表示個別試題反應與測驗總分的一致性越高
標準參照測驗的鑑別度分析方法
教學前後的差異
接受教學與未接受教學的差異
公式: D=P post(教學後答對比率)-P pre(教學前答對比率)
公式: D=Pi(接受教學組對比率)-Pm(未接受教學組對比率)
難度與鑑別度之關係
精熟組和非精熟組的差異
難度是鑑別度的必要條件
試題難度P值越接近0.50,則其所能發揮的區別作用越大
鑑別度的值域介於1~-1之間,指數越高,鑑別度越大