Please enable JavaScript.
Coggle requires JavaScript to display documents.
CHƯƠNG 8. KIỂM ĐỊNH GIẢ THUYẾT, vài điều độc lạ - Coggle Diagram
CHƯƠNG 8. KIỂM ĐỊNH GIẢ THUYẾT
hiểu được ý nghĩa của
kiểm định giả thuyết
giả thuyết
là 1 phát biểu về 1 tham số của quần thể
mục đích: đưa ra quyết định giả thuyết nào trong
2 giả thuyết bổ sung (H0 và H1)
là đúng bằng cách kiểm tra 1 mẫu được chọn từ quần thể đó
giả thuyết không, H0
thường
là mệnh đề phủ định với giả thuyết nghiên cứu muốn chứng minh
là giả thuyết sẽ được kiểm định
luôn có dấu
"="
làm thế nào để kiểm tra sự phù hợp với H0?
phải tính được giá trị p
giả thuyết nghiên cứu, H1
là giả thuyết mà nhà nghiên cứu tin là đúng và muốn chứng minh
thường
đối lập với giả thuyết không H0
có thể hoặc không thể chấp nhận
giá trị p
là
xác suất
xảy ra sự kiện mà ta đã
thấy
trong nghiên cứu nếu ta
giả định
giả thuyết
H0
thật sự
đúng
với mỗi kiểm định ta sẽ có riêng 1 giá trị p
so sánh giá trị p với ngưỡng ý nghĩa alpha để quyết định bác bỏ hay không bác bỏ giả thuyết H0
mức ý nghĩa alpha (α)
là khả năng sai lầm được chấp nhận nếu quyết định loại bỏ H0 khi H0 đúng
được chọn trước khi bắt đầu cuộc diều tra
chọn ngưỡng alpha bao nhiêu là phù hợp?
thường chọn ngưỡng 5% hay 1%
p<α
bác bỏ H0
chấp nhận H1
p>α
không thể bác bỏ H0
lưu ý:
coi chừng diễn giải sai giá trị p
sai lầm loại 1 (
α
)
sai lầm của việc bác bỏ H0 khi nó đúng
sai lầm loại 2 (
β
)
sai lầm của việc không bác bỏ H0 khi nó sai
1 - β
= sức mạnh
=khả năng phát hiện sự khác biệt, nếu thật sự có sự khác biệt
chọn được đúng các kiểm định thống kê
kiểm định t
so sánh 2 số trung bình
(giá trị đặc trung của biến định lượng)
các dạng bài
so sánh 2 số trung bình ở 2 mẫu
độc lập
TH1: n1 >= 30, n2 >= 30
tử
hiệu số 2 trung bình của 2 nhóm
mẫu có
độ lệch chuẩn bình phương của nhóm 1 chia tổng số quan sát của nhóm 1 = (sai số chuẩn)^2
độ tự do ∞
TH2: n1 < 30 hoặc n2 < 30
(dùng biểu thức đầu tiên)
xác định vị trí của t ở độ tự do = n1 + n2 -2
quan sát giá trị
sig. (2-tailed)
=
p
so sánh p với α=0.05
nếu không thỏa điều kiện phân phối bình thường
dùng test phi tham số
U Mann Whitney
so sánh 1 số trung bình
quan sát
với 1 số trung bình
lí thuyết
x(tb): giá trị ta quan sát được trong nghiên cứu của ta
μ: giá trị có trước từ nghiên cứu trước (giá trị có sẵn từ trong biến số)
độ lệch chuẩn/căn(n)=sai số chuẩn
nếu n >= 30, XĐ vị trí của t ở độ tự do = ∞
nếu t < 30, XĐ vị trí của t ở độ tự do = n-1
dùng
Analyze\Compare means\One sample t-test
nếu
p (tức sig. (2-tailed) rất nhỏ
thì
ghi p < 0.001 (trình bày trên văn bản)
nếu không thỏa điều kiện phân phối bình thường
dùng test phi tham số
Wilcoxon
so sánh 2 số trung bình
bắt cặp
d (difference): hiệu số trước trừ sau hoặc sau trừ trước của 1 biến số (nhưng phải thống nhất)
giá trị d dù âm hay dương cũng phải giữ nguyên
d (tb) là trung bình của các giá trị d, khi áp CT nếu d âm thì ta dùng trị tuyệt đối
nếu n >= 30, XĐ vị trí của t ở độ tự do = ∞
nếu n < 30, XĐ vị trí của t ở độ tự do = n - 1
dùng
Analyze\Compare means\Paired sample t-test
nếu không thỏa điều kiện phân phối bình thường
dùng test phi tham số
Wilcoxon
điều kiện áp dụng: 2 mẫu khảo sát phải thỏa 2 điều kiện sau
có phân phối chuẩn
đồng nhất với nhau (nếu so sánh trung bình ở 2 mẫu độc lập)
chi (
ki
/kai) bình phương
so sánh 2 tỉ lệ
(giá trị đặc trưng của biến định tính)
là kiểm định
phi tham số
so sánh phân phối của dữ liệu mẫu với một dữ liệu có sẵn
so sánh 2 bộ dữ liệu khác nhau
các dạng bài
so sánh 1 tỷ lệ
quan sát
với 1 tỷ lệ
cho trước
các bước thực hiện
bước 1: đặt giả thiết H0
bước 2:
lập bảng tần số lí thuyết và tần số quan sát
bước 3: tính giá trị chi bình phương theo công thức tổng quát
Q
: quan sát (
O
bservation)
L
: lí thuyết = mong đợi (
E
xpected)
dùng
Analyze\Nonparametric tests\chi-square
chi bình phương
so sánh 2 tỷ lệ ở 2 mẫu
độc lập
dùng
Analyze\Descriptive statistics\Crosstabs
có thể dùng
chi bình phương Pearson
(
các tần số lí thuyết đều phải > 5
)
Fisher's Exact Test
(có 1 hay vài tần số lí thuyết nào đó < 5)
các bước thực hiện
bước 1: đặt giả thiết H0
bước 2:
lập bảng 2x2
bước 3: tính giá trị \chi^2
so sánh 2 tỷ lệ
bắt cặp
dùng Analyze\Descriptive statistics\Crostabs...
McNemar test
cần dựa vào các yếu tố sau:
(1) loại biến số khảo sát (định tính, định lượng)
(2) số nhóm khảo sát (1 nhóm, 2 nhóm, >2 nhóm)
(3) tính chất của mẫu khảo sát (độc lập,bắt cặp)
bắt cặp
trước sau trên cùng 1 mẫu
VD: đo mức độ giảm cân ở người béo phì
đo cân nặng ban đầu
trên cùng 1 đối tượng người béo phì
đo cân nặng lúc sau
cặp...? (không nghe rõ)
VD: sự khác nhau của trung bình điểm số ở SV Y1
trung bình môn hóa
trùng bình môn toán
theo từng cặp đồng thời nhau về đặc điểm nào đó trong thiết kể bệnh chứng
VD: khảo sát UT phổi có liên quan hút thuốc lá
lấy 1 người nam 60 tuổi bị UT phổi
cũng phải lấy 1 người nam 60 tuổi bình thường
(4) phân phối của mẫu khảo sát (phân phối chuẩn?, đồng nhất?)
có thể đánh giá nhanh bằng cách
xem xét cỡ mẫu rất lớn (>100, >500)
lấy độ lệch chuẩn/trung bình <50%
khả năng rất cao phân phối này là phân phối bình thường
đánh giá có đồng nhất hay không?
vd: phương sai điểm trung bình cuộc sống ở nhóm nam
có tương tự
nhóm nữ hay không?
tiến hành kiểm định cho phương sai, cho giả thiết H0: phương sai là như nhau
dùng Levene's Test
quan sát giá trị
sig.
Lưu ý:
khi lựa chọn và thực hiện kiểm định thống kê, cần lưu ý các điều kiện của kiểm định
tính được các kiểm định thống kê
t
chi bình phương
biết cách biện luận kết quả của kiểm định giả thuyết
vài điều độc lạ
tại sao kiểm định H0 thay vì H1?
logic của 1 phiên tòa
để CM ai đó có tội, trước tiên giả định người đó
vô tội
giả định này chỉ được giữ lại cho tới khi có bằng chứng hợp lí cho thấy người đó có tội
tới lúc này, ta mới có quyền bác bỏ giả định vô tội lúc đầu và tuyên người đó có tội
tương tự, logic này được áp dụng trong thống kê
bắt đầu bằng giả định "giả thuyết H0 đúng"
tiếp theo, kiểm tra xem dữ liệu phù hợp với H0?
nếu phù hợp
giữ lại H0
nếu không phù hợp
loại bỏ H0
không thể loại bỏ H0 không có nghĩa H0 đúng. Chỉ là, mẫu nghiên cứu không đủ bầng chứng để hỗ trợ H1
kiến thức cần nhớ
độ lệch chuẩn
standard deviation (Std.Deviation)
sai số chuẩn
standard error mean (Std.Error Mean)
với bài toán 2 tỷ lệ bất kể n bao nhiêu
ta luôn dò bảng ở độ tự do =1
kiểm định chi bình phương dùng để
kiểm định dựa trên số đếm
nhóm nữ bao nhiêu người bệnh?
nhóm nam bao nhiêu người bệnh?
kiểm định xem có sự khác biệt giữa tần số quan sát với tần số lý thuyết do ngẫu nhiên hay không?
tần số quan sát: đếm bao nhiêu cá thể trong từng mẫu nghiên cứu trong từng phân nhóm của biến số
tần số lí thuyết (tần số dự kiến)?
kiểm tra kiến thức lại từ 1h21m44s