Please enable JavaScript.
Coggle requires JavaScript to display documents.
教育與心理測驗, 教育與心理測驗2, 試題 (編制原則, 難度, 鑑別度(-1~1), 試題偏差), 信效度 - Coggle Diagram
教育與心理測驗
測驗分類
4
標準化測驗
編制、實施、評分有統一規定
受試者受相同待遇
要建立常模
例如:比西測驗、區分性向測驗
非標準化
實施計分不嚴格要求
未建立常模解釋測驗依據
例如:教師自編測驗
1
標準參照
特定精熟性考驗
事前決定量尺點
結果表示:及格或不及格
傳統百分制
用途
診斷:補救教學
常模參照
相互比較
事先決定量尺定準點
用來鑑別、比較團體成員之間差異
結果表示:百分等級
用途
安置:分班編組
3
認知
測量心理的能力
情意
測量個人的人格
包含態度、動機、興趣、價值觀...
方法包含投射技術、評定量表、行為觀察、情境測驗、社會計量法
2克朗巴赫
最高表現
目的為引起受試者最佳反應
智力測驗、性向測驗、成就測驗
典型表現
在特定情境中的自然反應
人格測驗
智力測驗
意義:測量智慧的高低,以智商IQ表示
分類
普通能力測驗
鑑別一般學習能力者
特殊能力測驗
鑑別特殊才能
ex音樂、美術、機械
早期發展
心理年齡
比奈、西蒙
心理年齡高於實足年齡,智力較高
根據語文、數學、常識的作業方式
比率智商
推孟修訂比西量表
斯比量表
IQ=MA/CA*100
生理計量
以感官敏感度為指標,推估智力高低
離差智商
魏克斯勒Wechsler
平均數100
標準差15
新趨勢
擴大傳統觀念,加上社會適應能力
身體運作也視之為智力
擴大非語文量表,減少語言背景影響
應建立不同常模,讓不同種族可以公平
測驗的意義與特性
評量
根據個人潛能對學習進步作價值判斷
蒐集、綜合和解釋學生學習資料,做教學決定
測量
根據量尺,用數字來描述個人特質的歷程
測驗
測量的工具;觀察和描述個人特質的一種系統程序
基本觀念
個人特質
有系統程序
標準的刺激
測驗的功能
教學決定(起點行為、確立教學目標、改進教學)
行政決定(選擇、安置、分類、教育計畫決定)
諮商與輔導決定(協助學生了解自己、診斷困難、輔導做選擇)
一般性決定(評估、診斷、預測)
性向測驗
意義:發現學生的傾向與長處,作為指導升學或選擇職業的依據
分類
綜合性向測驗
個人多面的特殊能力;
推估在哪方面潛力較高/低
特殊性向測驗
鑑別個人具有哪一面的潛在能力
特性
取材範圍廣比較廣和普遍
偏向學習新事物的能力,重視未來表現潛能
預測將來某方面可能的成就
成就測驗
意義
考察個人經由學習或訓練的結果
綜合成就測驗
某一層次的多種科目
一般性知識與技能
分科成就測驗
某科或某方面的技能與知識
成績判斷或是診斷學習困難
特性
取材依據學校課程目標和教材
年級常模
測量受試者在某種學科內所養成的特殊能力
測驗常模
實際表現的平均成績或中等水準,可以顯示相對地位
分類
發展性常模
年齡
年級
適用於教育成就測驗
體內常模
百分位數
百分等級表是在一群分數中低於某一分數所佔百分率
優
淺顯易懂
適用不同對象和測驗
不受原始分數分配型態影響
缺
單位不等
不適用運算
標準分數
以平均數為參照,用離均差表示
類別
轉換方式
直線標準分數
常態化標準分數
定準點和尺度
Z分數、T分數、AGCT分數、CEEB、離差智商、標準九
其他
全國性
全國地區作母群體
隨機
地區常模
同一地區相同屬性
學校之間或城市之間
學校常模
以學校同年級學生為樣本
不同學校同年級學生之間
特殊團體
特殊屬性為樣本
盲生、聾人、教會學校
校定常模
與新測驗性質相同或密切相關且經過標準化的舊測驗作為定準測驗
變通性評量(另類評量)
不同於傳統紙筆測驗和客觀測驗型態
檔案評量
意義
用以評鑑學生的學習情形
包含技能、想法、興趣成果
長時間、有系統彙整
反映學習成果和呈現成長表現
特色
學生是被評量也是評量協助者
教師要了解每一位學生成長情形
優
提供過程與結果評鑑
真實、動態、整體
主導權在學生
結合教學與評鑑
尊重學生個別差異
結合多種評量方法
類型
最佳作品檔案評量
成長與學習進步檔案評量
動態評量
時間的連續性
成長的連貫性
評量工具的多樣性
對象的適切性
特性
兼重前中後評量
測驗---介入---再測驗
評量程序有可變性
重視評量者和受試者的互動
概念類似Vygotsky的近側發展區
實作評量
意義:將所學表現在具體成果或應用過程,著重高層次能力
特色:答案不只一種,考量過程,不限單一學科,時間彈性,實際生活有關
優缺
優:評量統整能力和歷程、符合近代學習理論
缺:費時費力、信度低、受月暈或先入主觀念影響、次數少
類型
結構化表現
模擬表現
工作樣本
辨認測驗
由各種不同真實性程度的測驗情境所組合成
紙筆表現
評分
分析
逐項給分
領域
兩者折衷
整體
打一個分數
生態評量
對個體及其環境中各因素進行評量
重點
整體評量系統
一般需求
個體需求
教學條件
教學效果
相關資源
過程
了解行為前後事件
了解環境與其的關係
明確界定行為
方式
直接觀察、紀錄分析、晤談、心理與教育測量
特徵
地點選擇
以受測者現在或未來可能接觸的各種環境為主
個別化評量過程
重於決定學生在適應環境的技能
透過各種形式的輔助幫助學生適應
真實性評量
目的:兒童在真實情境直接去操作,建構有意義的學習
特性:強調應用、真實的問題、鼓勵開放思考
意義:實際操作,重視應用、解決問題、直接評量與開放思考(杜威的教育即生活)
教育與心理測驗2
人格測驗
自陳
根據個人的感覺或實際狀況,逐一回答
種類
只測一種人格特質/ex:吳偉士個人事實表格
測量不同人格特質/ex:少年人格測驗
根據因素分析研究結果編制/ex:塞斯通性格測驗
根據人格理論編制/ex:愛德華個人興趣量表
編製方法
內容效度法/內容顯現出想測的人格特質
經驗效標記分法/題目選擇根據一些外在的效標
因素分析法/題目間高相關,都在測共同因素
人格理論法/依理論對人個特質的定義,再編擬可以代表的題目
注意事項
隱蔽測驗目的
設證實分數以檢查受試者答案是否可靠
告知受試者與學業成績無關
應與其他資料相對照再應用
測驗前,讓受試者了解測驗在幫助認識自己
投射
把個人自己的思想、態度、願望、情緒或特性反應於外界
種類
聯想法
一連串不相連續的字或墨漬
榮格的文字聯想測驗
羅夏墨跡測驗
構造法
根據看到的圖片編造一套有過去現在為來的故事
莫雷之主題統覺測驗
完成法
給一些不完整的文句或故事
羅特之為完成語句測驗
選組法
根據特定準則來選擇項目或作排列
宋迪測驗
表達法
以繪畫、遊戲、心理戲劇等自由行動與語言表現
卡爾科乞的畫樹測驗
情境
在設計的實際情境中,從事活動,以觀察受試者在此種情境中的行為,再對其人格加以評判
種類
日常情境測驗
佈置情境與日常生活情境相似
緊張情境測驗
情境具有各種不同的壓力
作業情境測驗
可間接評判某種人格特性
評定
就預測量的人格特性,列舉許多有關項目選擇和受評者日常的一項加以劃記
簡介
卜氏兒童社會行為量表
卜里奇
2-5歲
內容
測幼兒與幼兒間社會行為
幼兒與成人間
猜人測驗
哈特送、梅爾、馬婁
目的
利用同班同學長時間相處互相評量
社交測量法
意義
熟悉群體中人際吸引的技術,如莫里諾的社會關係測驗
鮑加都氏的社會距離量表
得分多,社會距離大、人緣差
態度量表
態度的意義
人對人或事持有持久而一致的行為傾向
態度的測量方法
觀察法
自陳量表
塞斯通的等距量表
李克特的總加量表
葛特曼的累積量表
奧斯古德的語意分析技術
Q技術
比率智商/離差智商
比率智商
IQ=MA/CAx100=心理年齡/生理年齡x100
離差智商
換算成標準分數,視其位置離開平均數的距離為標差的幾倍,從而判定智力高低。
斯比智力量表(平均數=100,標準差=16),魏氏智力量表(平均數=100,標準差=15)
試題
編制原則
選擇題
構成
題幹
選項
優
適用不同層次學習節果
編制較容易
最佳答案型式
信度較高
可避免學生依習慣作答
具診斷效果
計分正確且迅速
缺
無法知道真實情境
不適用數學問題或科學
編制誘答較困難
編制
每道只能測一個學習結果
避免採用否定句
誘答編制應似是而非
避免用以上皆是、以上皆否
隨機編排
不可依照教科書內容順序排列
每題選項數目應一致
申論題
缺點
試題少且取樣不廣也不均、內容效度低
易產生月暈效應、評分效度低
命題技術改進
增加題數、提高信效度
優點
可用來測量綜合、評鑑
增進學生寫作與表達的能力
評分技術
採用匿名或密封方式閱卷,避免月暈
事先決定各題測量的因素及其比重
配合題
優
極短時間測量相關事實資料
較容易編制
計分容易且客觀
增進對比觀念與整理能力
缺
僅測機械式記憶
選項容易提供額外線索
尋找性質相關的材料不容易
編制
題幹或選項性質必相似
選項要多於題幹的項數
選項要依邏輯排列
配對題目以不超過十項為原則
是非題
優點
適用測驗錯誤的習性或誤解
適合測量辨認因果關係
命題容易、適用於多數學科
缺點
鑑別作用比選擇題差
易受猜測影響
編製原則
每題只能包含一個重要的概念
盡量少用否定的敘述,尤避免雙重否定
文具應重新組織,避免直接抄錄教材文句
難度
常模
全體答對或通過該題的百分比
P=R/N x 100%
高分組答對的百分比加低分組答對百分比再除以2
高(低)分組=得分最高(低)的各25-33%
凱利主張高(低)分組各27%
難度0.5時鑑別度最高
難度△值
具等距尺度特性
以13為平均數,4為標準差,1-25的標準分數
△=13+4X
△值越小,難度越低(與P值相反)
標準
難度指數高
和通過標準相符(例90%為精熟標準,理想難度應為0.9)
難度P值
P值越大,難度越低
為順序尺度,單位不相等
鑑別度(-1~1)
標準
接受教學VS未接受教學
精熟組VS非精熟組
教學前後的差異
常模
內部一致性(諧度分析)
試題反應與測驗總分的關聯性
比較高低分組的通過的百分比
外在效度
檢驗每個試題是否有某種鑑別作用
試題偏差
原因
試題有意識型態
內容受文化背景影響
語言因素
偏向某些生活經驗
相同受試者對同一測驗答對或答錯機率不同
信效度
信度
影響信度因素
測驗難度
評分者客觀性
間隔時間長短
信度之估計方法
受試者變異性
測驗長度
特性
相對程度上的差異
非普遍性特質
心理與教育測驗信度較低
邏輯分析
越高越好
類型
再測
優
結果是否隨時間變化,可預測未來表現
缺
易受練習和記憶影響,測驗間隔時間宜適度
意義
前後測驗兩次,又稱穩定係數
誤差來源
時間取樣
複本
優
不受練習和記憶的影響
缺
編制不易
意義
一測驗有兩種以上複本
誤差來源
同時測
內容取樣
間隔測
時間取樣與內容取樣
折半
意義
全部試題單雙題分半,計算每人在兩半測驗總得分再求相關係數
算法
優
簡易
缺
容易受動機、緊張、疲勞及其他因素影響
無法提供時間穩定性的資料
誤差來源
內容取樣
庫李
優
只要實施一次就能計算信度係數
缺
只能運用在二分法的測驗,計算較繁瑣
算法
庫李20號公式
誤差來源
內容取樣與內容異質
意義
庫德、李查遜1973設計分析測驗項目間一致性以估計信度的方式
評分者
不同/同一評分者在不同時間觀察、紀錄、評分相互之間的一致性
使用時機
人格測驗
創造性思考測驗
申論
誤差
評分者
求法
相關分析
變異分析
穩定性或一致性
測量標準誤
效度
特性
相對差異而非絕對
特殊而非普遍
測驗結果正確性程度,非指工具本身
非實際測量而得
測驗工具最重要的條件
類型
效標關聯
以測驗分數和效度標準之間的相關係數表示
分類
同時效度
和當前效標之間
學業成績、教師評定名次
預測效度
和將來效標資料
專業訓練或研究的成績與實際工作的成果
特性
適切性、可靠性、客觀性、可用性
效標種類
學業成就、實際工作成績、先前有效地測驗
中間效標
特殊計畫的訓練成績和專門學校的學習成績
終極效標
個人生涯成功的評價
建構
能測量理論概念或特質的程度
方法
因素分析法/找出測驗共通性
團體差異分析/預測因團體的特性不同而異
外在相關法/已具效度的測驗作為效標
發展的改變與實驗介入/比較不同年齡在測驗是否達顯著差異
內部一致性
多項方法分析/建立區別性效、輻合性效度
常是心理測驗所採用
內容
雙向細目分析表:表格上方表示教學目標,左方表示教材範圍
又稱課程效度、邏輯效度或專家效度
有系統的檢查測驗內容的適切性
正確性(能測出預測量的特質或功能)
計算:與屬性有關的變異量/ (誤差變異量+與屬性無關變異量+與屬性有關的變異量)
信度與效度的關係
限度是效度的必要條件而非充分條件
效度高,信度一定高
效度低,信度未必低
信度低,效度一定低
信度高,效度未必高
信度係數的平方根是效度係數的最高限