Chapter 6 Reliability ความเชื่อมั่นของแบบทดสอบ

Chapter 6
Reliability
ความเชื่อมั่นของแบบทดสอบ

Test Theory

แนวคิดทฤษฎีที่เกี่ยวกับ Reliability

ทฤษฎีบทที่เกี่ยวข้องกับ Reliability

ประกอบด้วย

ความเที่ยง

ความเชื่อมั่น

Item Response Theory(IRT)

Classical Test Theory

การหาวิธีที่จะประมาณค่าของความไม่คงเส้นคงวาต่อความแม่นยำของการวัดทางจิตวิทยา

แบบวัดที่สมบูรณื

แบบวัดที่มีความคงเส้นคงวา(Consistency)
ในการกำหนดคะแนนของบุคคล

จะวัดกี่ครั้งก็ได้ผลแบบเดิมเสมอ

คะแนนที่ได้จากการวัดสะท้อนให้เห็นถึงอิทธิพลของปัจจัย 2 ปัจจัย

“จุดเริ่มต้นของแนวคิดเกี่ยวกับ Reliability ตามแนวคิดของ Classical test Theory”

ปัจจัย 2 อย่าง

ปัจจัยที่ทำให้เกิดความคงเส้นคงวา

ปัจจัยที่ทำให้เกิดคามไม่คงเส้นคงวา

ลักษณะที่คงที่ของบุคคลหรือลักษณะที่เราพยายามจะวัด

ลักษณะบางประการของบุคคล หรือสถานการณ์ที่มีผลต่อคะแนน แต่ไม่ใช่สิ่งที่เราต้องการวัด

ทฤษฎีบทนี้ให้ข้อสมมติว่า แต่ละบุคคลมีคะแนนที่แท้จริง ซึ่งสามารถหาค่าได้ ถ้าไม่มีความคลาดเคลื่อนของการวัด อย่างไรก็ตาม เครื่องมือวัดต่างที่ดีสมบูรณ์ คะแนนที่ได้จากการวัดจึงแตกต่างจากความสามารถที่แท้จริงของบุคคลความแตกต่างระหว่างคะแนนที่แท้จริงกับคะแนนที่ได้จากการสังเกต เป็นผลมาจากความคลาดเคลื่อนของการวัดนี่เอง

จุดมุ่งหมายของแนวคิด

การประมาณค่าความคลาดเคลื่อนในการวัด

การให้ข้อแนะนำวิธีการปรับปรุงแบบวัดที่ทำให้เกิดความคลาดเคลื่อนน้อยที่สุด

ข้อตกลงเบื้องต้นที่สำคัญ

ความคาดเคลื่อนในการวัดต้องเป็นแบบสุ่ม(Variable)

คำว่า สุ่ม(Random) ไม่ได้หมายความว่าเป็นกระบวนการสุ่ม หรือกระบวนการที่ลึกลับ

วิธีการประมาณค่า Reliability

Reliability คือ

ต้องการศึกษาว่ามีความแปรปรวนที่เกิดจาก error of measurement เท่าไหร่ และมีความแปรปรวนที่เกิดจาก True score เท่าไร

Alternative forms methods

Split-half methods

Test-retest methods

Internal consistency

ลักษณะ

วิธีการ

คะแนนที่ได้จากการสอบมีความคงเส้นคงวาเท่าไรจากการสอบครั้งที่ 1 และ 2

เหมาะสำหรับการวัดสิ่งที่ค่อนข้างจะคงที่

เป็นวิธีการเก่าแก่ที่สุด

นำ Test A ไปสอบกลุ่มคนกลุ่มหนึ่ง

นำ Test A(ชุดเดิม) ไปสอบคนกลุ่มเดิมในเวลาต่อมา

หา Corr ระหว่างคะแนนที่ได้จากการสอบ 2 ครั้ง

Coefficient of stability

ลักษณะ

วิธีการ

เนื้อหาของ A เหมือน B ความยากง่าย A เท่ากับ B แต่ไม่จำเป็นต้องมี S^2,X ̅ เท่ากัน

Test A

Test B

สอบกลุ่มตัวอย่างA

ข้อเสีย

ผู้ถูกทดสอบอาจมีความถนัดนาการทำข้อสอบไม่เหมือนกัน

สร้างยากและสิ้นเปลืองเงิน และเวลา

คะแนนที่ได้จากการทดสอบอาจเกิดจากผลกระทบของ

เป็นการยากที่จะการันตีว่า test 2 test คู่ขนานกัน

ความเหนื่อย

การเรียนรู้การฝึกฝน

แรงจูงใจ

ข้อเสีย

ข้อดี

วิธีการ

แบ่งโดยใช้ข้อคู่ข้อคี่

แบ่งครึ่งข้อสอบ/แบบทดสอบ Test A มี 40 ข้อ 20 ข้อแรก (1-20) 20 ข้อหลัง(21-40)

ไม่ต้องสร้าง test 2 ฉบับ

Carry over effects และ reactivity มีน้อย

ไม่ต้องสอบ 2 ครั้ง

ผลของการเปลี่ยนแปลงเนื่องจากเวลามีน้อย

มีวิธี split (แบ่งครึ่งข้อสอบ) หลายวิธีแต่ละวิธีให้ค่า Reliability ที่แตกต่างกัน

Inter Item Consistency

Correlationระหว่างข้อคำถามทั้งหมด

วิธีการหา Inter Item consistency

คำนวณจากการสอบครั้งเดียวข้อสอบชุดเดียว

วิธีการประมาณค่า

Coefficient alpha (α) (สัมประสิทธิ์ α

วิธีการของ Hoyt

The kuder-Ricardson Formulas (KR-20,KR 21)

Frederic Kuder M.W.Richard ไม่พอใจกับวิธีการประมาณค่าโดยวิธี Split-half จึงคิดสูตรเอง