Please enable JavaScript.

Coggle requires JavaScript to display documents.

測驗與評量的重要性, (成就)測驗的目的, 評測高品質的要素 - Coggle Diagram

- - - - 評估學生的先備能力
      - 學習華語的目的
      - 學習特性
- - - - 測驗內容及所評量能力之間的對應關係
      - 著重在認知歷程的向度
    - - 效標-衡量測驗有效性的外在標準，通常是指我們所要預測的行為（終極表現／獨立測量表現）
        
        可以用來作為效標的變數有很多。可以是現成的指標（如產量、薪水），也可以是人為設計的指標（如課堂測驗）
        
        常見的效標主要有學業成就、等級評定、臨床診斷、特殊訓練成績、實際工作表現、對團體的區分、其他測驗成績。
      - 【效標關聯度】
        
        1.預測效度 Predictive Validity
        
        在測試後經過一段時間，取得受測者在效標行為的表現之獨立測量。
        經計算測驗表現和效標行為測量之相關。
        
        學測 VS. 學業表現 (透過一測驗表現推估學生入學後未來的表現)
        
        預測效度須經一段時間才能反應效標的準確性。
        
        2.同時效度 Concurrent Validity
        
        同時效度的效標資料是與測驗分數同時搜集的。
        
        憂鬱量表 VS 醫師診斷。
    - - 構念-抽象而屬假設性的概念、特質或變項
        
        不同的語言理論對於語言能力應包含哪些要素，將各語言成分區隔開來，在測驗評量中即稱為：不同的構念。
        
        智力、焦慮、機械性向、成就動機等。
      - 【構念效度 Construct Validity】
        
        以理論構念解釋測驗結果的作法。
        
        內容證據、效標關聯證據等，都是構念效度的部分證據。
        
        Messik 主張構念效度有六個層面之證據
        
        內容面
        
        評量內容與欲測特質之關聯性 (內容關聯效度)
        
        實質面
        
        受測者用到理論歷程完成評量作業,評量反應符合理論(如:難易程度分配)
        
        結構面
        
        評分模式忠實反映構念結構
        
        類推面
        
        分數能類化到不同群體與作業
        
        外在面
        
        外在變項的幅合與區辨效度 (效標關聯度)
        
        幅合效度-外在變項的幅合與區辨效度 (效標關聯度)
        
        區辨效度-不同構念以相同／不相同的方法測量，都會得到低相關(二者和信度相關)。
        
        後果面(後效作用)
        
        評量分數使用的實際與潛在影響
        
        使用評量所產生的所有後果　（含預期／非預期）
        
        構念效度是評量效度的核心概念！！
- - - - 1.冒犯-刻板印象
      - 2.不公平懲罰-試題對某一族群的考生較為不利（如特定專業領域文章出現頻率過高）。
- - - - 定義-在不同的時間點,對一群受者重複實施同一評量工具，取得兩次施測結果的一致性（相關係數）。
      - 影響因素-身心狀態、外在物理環境（如：噪音）
      - 時間-相距兩到四週之間。（時間間隔越長，再測信度越低）
      - 分析-相關分析或顯著性檢驗法，可以評價量表信度的高低。結果越是相關，差異不顯著則信度越高。
    - - 副本-兩份評量，其題目數、題目形式與內容、題目的難易度、施測的指導語、時間限制、評量相關的特性等，都十分類似。
      - 內容取樣誤差-複本因題目選擇的隨機因素所造成的分數變異。（愈小愈好）
        
        【複本立即信度】
        
        兩個複本在同一時間內施行於一群人，這兩組評量結果的一致性。（受測者評量負擔大)
        
        【複本延宕信度】
        
        間隔一段時間後，再以複本進行第二次評量，後估算兩組評量的一致性。
        
        優點-可將遺忘曲線考量進去。
      - 複本信度：透過複本取得評量結果的一致性。
    - - 只一個題本、一次測量結果便能估計信度。
        
        關心的是受試者在各評量項目（構念）上表現一致的程度。
      - 重要特徵-評量項目不加總計分，但所有評量項目測的是同一能力／特質。
        
        通常會將聽、說、讀、寫技能分開評量，每項技能都要達到特定分數，才算達到精熟。
        
        不傾向四技得分加總／各自獨立。
      - 能夠反映出評量的試題同質之程度。
      - 測量方式
        
        【評分者信度】
        
        牽涉到評量者的對表現評分的一致。分析評分者評分結果的相關性，或給予相同評分的比例作為評分者信度指標。
        
        需仰賴評分者的判斷，如：口說或書寫的評分。
        
        【折半信度】(出題方式)
        
        研究者在建立測量工具時，將原有的題目數擴充為二倍。
        
        其中有一半是另一半的重複或相似的題目，研究者以二個部分的得分的比較，來估算此測量工具的信度。
- - - - 否則會勞師動眾，而且可信度受到質疑
    - - 以最少的時間，獲取最可靠的評量訊息
        
        選擇題 VS 實作評量
    - - 評量實施的容易度
      - 計分的容易度
      - 分數解釋的容易度