Please enable JavaScript.
Coggle requires JavaScript to display documents.
電腦化適性測驗 - Coggle Diagram
電腦化適性測驗
電腦化適性測驗的要素
電腦化適性測驗的評價
優點:加強測驗的安全性
無需使用答案紙
依據需求來進行施測
適合每位考生的作答程度
立即的計分和報告成績
降低某些考生的考試挫折感
加強施測的標準化過程
容易從題庫中找出並刪除不良的試題
缺點
不能跳答 2. 必須依順序作答 3. 某些題型較不適用
終止標準
固定長度法
精確估計受試者的能力
預定測量標準誤法
標準差&後驗標準差(PSD)
無法獲得更多的測驗訊息
能力估計已穩定
貝氏信賴區間法
精熟測驗(AMT)
測驗特徵曲線(TCC)
試題反映理論的模式
二參數模式
單參數模式
三參數模式
題庫
鑑別度參數應在0.8以上
應包含鑑別度、難度、猜測度
題庫題數最少在100題以上
起始點
全隨機抽取一個試題
調查學生的背景,再決定出哪一類的試題
自難度適中的試題中隨機抽取一個試題
選題方式
最大訊息選題法
貝式選題法
計分方法
最大可能性估計
貝式估計法
電腦化適性測驗之未來趨勢研究主題
多重量表
CAT在施測時同時包含各種不同類型、施測目的的量表
CAR的終止標準
根據測驗目的和性質,可設定高低的終止標準,也可設定一個以上的終止標準
試題曝光度
線上CAT
線上考試並進行即時計分
加強自動化命題和組卷對電腦化適性測驗永續經營有益處
評量取向為組別平均數而不是針對個別成就平均數
內容平衡
電腦化適性測驗的背景
一 、電腦化測驗的發展
Bunderson 、Inouye 、Olsen(1989)
第一代
電腦化測驗(CT)
古典測驗理論(CTT)
第二代
電腦化適性測驗(CAT)
試題反映理論(IRT)
第三代
系統連續性測量(CM)
多向度試題理論(MIRT)
第四代
智慧型評量(IM)
Bennet(1998)
第一代(題庫和施測邏輯)
新世代(電子化 、自動化)
R世代(互動式 、適性化)
Eiji Muraki(2004)
實作為導向的試題
具有互動式的反應
真實或模擬的情境下施測
具有高度的認知功能
具有等級計分的功能
二 、電腦化測驗的類別
傳統的電腦化測驗(CBT)
古典測驗理論
電腦化適性測驗(CAT)
試題反映理論
線上測驗(WBT)
古典測驗理論 、試題反映理論
三 、電腦科技的進步
考試進入電子化
考試電子化遇到的問題
較以單一選擇題為主
電腦化測驗的信度 、效度需再審視
發展現狀
發展機構
(3)專業機構:ETS、ACT
(1)政府機構:以色列、荷蘭
(2)大學校院:劍橋大學英文考試院、西班牙奧托諾馬德里大學
(4)學術組織:AICPA協會、NABP協會
(5)其他:Microsoft商業公司
較先進國家:已有大型且值得信賴的專業測試機構及學術組織
較小的國家:必須要有政府機構以公部門的經費來研發建置
測驗性質
電腦化適性測驗(CAT)
能力檢定 或 入學許可(TOEFL、GRE、GMAT、SAT、ACT)
證明考試(MCP、UCPAE、NAPLEX、NCLEX-PN/RN)
能力檢定(ESS、eCAT)
CAT的發展
有些是從紙筆式測驗轉變為CBT,再到CAT
有少數是直接從紙筆測驗到CAT
傳統的電腦化測驗(CBT)
證照類
助產士
牙醫師
航海技術
我國CAT的發展
可先以目前已電腦化的考試作為基礎,再加以發展成CAT
施測時間及題數
世界各國所發展的CAT施測時間大約在1-3小時之間
少數測驗因含有口說或實作等測驗,如SAT或GMAT需要4小時
我國目前的國家考試大多需要1-2天的時間
改善目標
1)未來發展以較少的題數來精準測量應考者的能力
2)縮短考試時間,減低試務工作的負擔