Please enable JavaScript.
Coggle requires JavaScript to display documents.
สรุปเนื้อหากระบวนวิชา 100209 (การวัดการกระจาย (คุณสมบัติของพิสัย QD MD …
สรุปเนื้อหากระบวนวิชา 100209
ความรู้พื้นฐานเกี่ยวกับสถิติ
ความหมายของสถิติ
ตัวเลขที่รวบรวมจากปรากฏการณ์ หรือเหตุการณ์ต่างๆ
ระเบียบวิธีทางสถิติ
ข้อมูลทางสถิติ
เชิงปริมาณ : แสดงเป็นตัวเลขได้
เชิงคุณภาพ : สิ่งที่ไม่ใช่ปริมาณอาจเป็นตัวเลขหรือไม่ก็ได้
ประเภทของสถิติ
ภาคบรรยาย
ภาคอ้างอิง
ตัวแปร
ตัวแปรตาม: ตัวแปรที่มีค่าแปรเปลี่ยนตามตัวแปรต้น
ตัวแปรต่อเนื่อง: มีการเปลี่ยนแปลงอยู่เสมอ
ตัวแปรต้น: ตัวแปรอิสระที่ไม่ขึ้นอยู่กับตัวแปรอื่น
ตัวแปรไม่ต่อเนื่อง: ไม่มีการเพิ่มหรือลดของข้อมูล
มาตราวัด
นามบัญญัติ (Nominal): จัดกลุ่มได้
จัดอันดับ (Ordinal): จัดกลุ่มได้+เรียงอันดับได้
อันตรภาค (Interval): จัดกลุ่มได้+เรียงอันดับได้+ช่วงห่างเท่ากัน+มีศูนย์เทียม
อัตราส่วน (Ratio): จัดกลุ่มได้+เรียงอันดับได้+ช่วงห่างเท่ากัน+มีศูนย์แท้
การวัดการกระจาย
การวัดการกระจาย
เป็นการศึกษาว่าข้อมูลในชุดหนึ่งๆ มีความแตกต่างกันมากน้อยเพียงใด (กระจายมากคือแตกต่างมาก )
พิสัย (Range)
เป็นการวัดการกระจายที่ง่ายที่สุด ได้ค่าหยาบๆ
พิสัยที่ไม่คลุมค่าสูงสุดและค่าต่ำสุด (ER)
ER = ค่าสูงสุด – ค่าต่ำสุด
พิสัยที่คลุมค่าสูงสุดและค่าต่ำสุด (IR)
IR = ค่าสูงสุด – ค่าต่ำสุด + 1
IR = ER + 1
IR = ขอบบนค่าสูงสุด – ขอบล่างของค่าต่ำสุด
ส่วนเบี่ยงเบนควอไทล์
ให้ข้อเท็จจริงใกล้เคียงความเป็นจริงมากกว่าพิสัย
ส่วนเบี่ยงเบนมาตรฐาน
ศึกษาถึงความแตกต่างของข้อมูลภายในกลุ่มว่ามีค่าแตกต่างกันมากน้อยเพียงใด นิยมใช้ควบคู่กับค่าเฉลี่ยในการบรรยายลักษณะของข้อมูล หาได้จากค่ารากที่สองของความแปรปรวน
คุณสมบัติของพิสัย QD MD SD เมื่อข้อมูลเปลี่ยนไป
• พิสัยคำนวณง่าย สะดวก แต่หยาบ
• QD เหมาะกับข้อมูลที่มีความเบ้
• SD ละเอียดที่สุด นิยมมากที่สุด ถ้าข้อมูลมีค่าเท่ากันหมด SD = 0 หากข้อมูลตัวหนึ่งเปลี่ยน SD จะเปลี่ยนตาม
• บวกลบข้อมูลเดิมทุกตัวด้วยค่าคงที่ที่เท่ากัน SD เท่าเดิม
• คูณหารข้อมูลเดิมทุกตัวด้วยค่าคงที่ที่เท่ากัน SD เปลี่ยนตาม (คูณ SDใหม่ = C×SDเดิม) (หาร SDใหม่ = SDเดิม÷C)
ความแปรปรวนรวม
สัมประสิทธิ์การกระจาย
การประยุกต์ใช้การกระจายและสัมประสิทธิ์การกระจาย
ถ้าใช้ฐานนิยมนำเสนอการกระจายด้วยพิสัย
ถ้าใช้มัธยฐานนำเสนอการกระจายด้วย QD
CV จะนิยมนำเสนอพร้อมกับค่าเฉลี่ยและ SD
ถ้าใช้ค่าเฉลี่ย จะใช้ SD หรือ SD2
ส่วนเบี่ยงเบนเฉลี่ย
ศึกษาถึงความแตกต่างของข้อมูลแต่ละค่าจากค่าเฉลี่ย ว่ามีค่าแตกต่างจากค่าเฉลี่ยไปโดยเฉลี่ยเท่าใด
การแจกแจงความถี่
การจัดข้อมูลให้เป็นหมวดหมู่ ทำให้ดูง่ายขึ้นและสะดวกในการคำนวณ
ขั้นตอนในการแจกแจงความถี่
1.เรียงข้อมูลจากน้อยไปมาก หรือมากไปน้อย
2.รอยคะแนน
3.นับรอยคะแนนรวมเป็นความถี่
ฮิสโทแกรมคือ กราฟแท่ง ความสูงแทนความถี่ ความกว้างแทนขอบเขตแต่ะชั้น
รูปเหลี่ยมความถี่ คือ กราฟที่แกนนอนเป็นคะแนนและแกนตั้งเป็นความถี่ แสดงแทนความถี่ของข้อมูล
โค้งความถี่คือ กราฟที่ใช้คะแนนเป็นแกนนอนและความถี่เฉลี่ยเป็นแกนตั้ง
การวัดตำแหน่ง
เดไซล์
แบ่งข้อมูลเป็น 10 ส่วนเท่าๆ กัน ตำแหน่งของเดไซล์ทำให้ทราบว่า ในข้อมูล 10 ส่วนมีข้อมูลที่ต่ำกว่าอยู่กี่ส่วน
การหาตำแหน่ง (แบบแจกแจงความถี่)
การหาค่าเดไซล์
การหาตำแหน่ง (แบบไม่แจกแจงความถี่)
ควอไทล์
แบ่งข้อมูลเป็น 4 ส่วนเท่าๆกัน ตำแหน่งของควอไทล์ทำให้ทราบว่าในข้อมูล 4 ส่วนมีข้อมูลที่ต่ำกว่าอยู่กี่ส่วน
การหาตำแหน่ง (แบบแจกแจงความถี่)
การหาค่าควอไทล์
การหาตำแหน่ง (แบบไม่แจกแจงความถี่)
เปอร์เซนไทล์
แบ่งข้อมูลเป็น 100 ส่วนเท่าๆ กัน ตำแหน่งของเปอร์เซนไทล์ทำให้ทราบว่า ในข้อมูล 100 ส่วน มีข้อมูลที่ต่ำกว่าอยู่กี่ส่วน
การหาตำแหน่ง (แบบไม่แจกแจงความถี่)
การหาตำแหน่ง (แบบแจกแจงความถี่)
การหาค่าเปอร์เซนไทล์
สหสัมพันธ์
สัมประสิทธิ์สหสัมพันธ์
Spearman Rank : ข้อมูลเป็นแบบจัดอันดับทั้งคู่
Kendall : ข้อมูลเป็นแบบจัดอันดับทั้งคู่ แต่ละส่วนมี
มากกว่า 2 ชุดขึ้นไป
Biserial : ข้อมูลเป็นแบบต่อเนื่องกับ Force dichotomy
Point – Biserial : ข้อมูลเป็นแบบต่อเนื่องกับ True dichotomy
Tetrachoric : ข้อมูลเป็น Force dichotomy ทั้งคู่
Phi : ข้อมูลเป็น True dichotomy ทั้งคู่
Contigency : ข้อมูลเป็นความถึ่ทั้งคู่ แต่ละส่วนมีมากกว่า 2 ชุดขึ้นไป
Pearson : ข้อมูลเป็นแบบต่อเนื่องทั้งคู่
การวัดแนวโน้มสู่ส่วนกลาง
คือ การหาค่ากลางของข้อมูล หรือหาตัวแทนเพื่อใช้อธิบายลักษณะของข้อมูลโดยรวม และใช้เปรียบเทียบข้อมูลต่างชุด
ค่ากลาง
มัธยฐาน (Median) คือ ค่าที่อยู่กึ่งกลางระหว่างข้อมูลที่มีค่าสูงสุดกับต่ำสุด ค่านี้จะแบ่งข้อมูลเป็น 2 ส่วนเท่ากัน
ฐานนิยม (Mode)
คือ ข้อมูลที่ซ้ำกันมากที่สุด ถ้าข้อมูลแจกแจงความถี่ให้ใช้สูตร
ค่าเฉลี่ย (Mean)
คือ ค่าที่ได้จากการหารผลรวมของข้อมูลทั้งหมดหารด้วยจำนวนข้อมูลทั้งหมด
คะแนนมาตรฐานและโค้งปกติ
คะแนนที่แปลงมาจากคะแนนดิบเพื่อใช้เปรียบเทียบคะแนนต่างชุดได้อย่างมีความหมาย
Z-score
เป็นตัวเลขที่ใช้บอกว่าค่านั้นมีค่าสูงหรือต่ำกว่าค่าเฉลี่ยเป็นกี่เท่าของส่วนเบี่ยงเบน มาตรฐาน
T-score
เป็นการทำให้ข้อมูลนั้นอยู่ในหน่วยเดียวกัน
T = 50 + 10Z
การแจกแจงปกติ
เป็นการแจกแจงความถี่ของข้อมูลที่มีลักษณะสมมาตร
ข้อมูลต่างชุดที่มีลักษณะการแจกแจงเหมือนกันหรือคล้ายกันสามารถนำมาเปรียบเทียบกันได้
ค่าเฉลี่ยคงที่ SD คงที่ (แปลงเป็นคะแนนซีหรือคะแนนที)
โค้งปกติ
สมมาตร
สัมประสิทธิ์ความเบ้ = 0
สัมประสิทธิ์ความโด่ง = 4
ค่าเฉลี่ย = มัธยฐาน = ฐานนิยม และทุกค่าอยู่กึ่งกลางโค้ง
พื้นที่ใต้โค้งเท่ากับ 1 ถ้าแบ่งกึ่งกลางจะได้ข้างละ 0.5