CHƯƠNG 8. KIỂM ĐỊNH GIẢ THUYẾT

hiểu được ý nghĩa của

kiểm định giả thuyết

giả thuyết không, H0

giả thuyết nghiên cứu, H1

giá trị p

sai lầm loại 1 (α)

sai lầm loại 2 (β)

chọn được đúng các kiểm định thống kê

kiểm định t

chi (ki/kai) bình phương

tính được các kiểm định thống kê

t

chi bình phương

biết cách biện luận kết quả của kiểm định giả thuyết

giả thuyết là 1 phát biểu về 1 tham số của quần thể

mục đích: đưa ra quyết định giả thuyết nào trong 2 giả thuyết bổ sung (H0 và H1) là đúng bằng cách kiểm tra 1 mẫu được chọn từ quần thể đó

là giả thuyết mà nhà nghiên cứu tin là đúng và muốn chứng minh

thường đối lập với giả thuyết không H0

có thể hoặc không thể chấp nhận

thường là mệnh đề phủ định với giả thuyết nghiên cứu muốn chứng minh

là giả thuyết sẽ được kiểm định

luôn có dấu "="

vài điều độc lạ

tại sao kiểm định H0 thay vì H1?

logic của 1 phiên tòa

để CM ai đó có tội, trước tiên giả định người đó vô tội

giả định này chỉ được giữ lại cho tới khi có bằng chứng hợp lí cho thấy người đó có tội

tới lúc này, ta mới có quyền bác bỏ giả định vô tội lúc đầu và tuyên người đó có tội

tương tự, logic này được áp dụng trong thống kê

bắt đầu bằng giả định "giả thuyết H0 đúng"

tiếp theo, kiểm tra xem dữ liệu phù hợp với H0?

nếu phù hợp

giữ lại H0

nếu không phù hợp

loại bỏ H0

không thể loại bỏ H0 không có nghĩa H0 đúng. Chỉ là, mẫu nghiên cứu không đủ bầng chứng để hỗ trợ H1

làm thế nào để kiểm tra sự phù hợp với H0?

phải tính được giá trị p

xác suất xảy ra sự kiện mà ta đã thấy trong nghiên cứu nếu ta giả định giả thuyết H0 thật sự đúng

với mỗi kiểm định ta sẽ có riêng 1 giá trị p

so sánh giá trị p với ngưỡng ý nghĩa alpha để quyết định bác bỏ hay không bác bỏ giả thuyết H0

lưu ý: coi chừng diễn giải sai giá trị p

mức ý nghĩa alpha (α)

là khả năng sai lầm được chấp nhận nếu quyết định loại bỏ H0 khi H0 đúng

được chọn trước khi bắt đầu cuộc diều tra

chọn ngưỡng alpha bao nhiêu là phù hợp?

thường chọn ngưỡng 5% hay 1%

p<α

bác bỏ H0

chấp nhận H1

p>α

không thể bác bỏ H0

sai lầm của việc bác bỏ H0 khi nó đúng

sai lầm của việc không bác bỏ H0 khi nó sai

1 - β = sức mạnh

=khả năng phát hiện sự khác biệt, nếu thật sự có sự khác biệt

cần dựa vào các yếu tố sau:

(1) loại biến số khảo sát (định tính, định lượng)

(2) số nhóm khảo sát (1 nhóm, 2 nhóm, >2 nhóm)

(3) tính chất của mẫu khảo sát (độc lập,bắt cặp)

(4) phân phối của mẫu khảo sát (phân phối chuẩn?, đồng nhất?)

Lưu ý:

khi lựa chọn và thực hiện kiểm định thống kê, cần lưu ý các điều kiện của kiểm định

bắt cặp

trước sau trên cùng 1 mẫu

cặp...? (không nghe rõ)

theo từng cặp đồng thời nhau về đặc điểm nào đó trong thiết kể bệnh chứng

so sánh 2 số trung bình (giá trị đặc trung của biến định lượng)

so sánh 2 tỉ lệ (giá trị đặc trưng của biến định tính)

các dạng bài

so sánh 2 số trung bình ở 2 mẫu độc lập

so sánh 1 số trung bình quan sát với 1 số trung bình lí thuyết

so sánh 2 số trung bình bắt cặp

điều kiện áp dụng: 2 mẫu khảo sát phải thỏa 2 điều kiện sau

có phân phối chuẩn

đồng nhất với nhau (nếu so sánh trung bình ở 2 mẫu độc lập)

VD: đo mức độ giảm cân ở người béo phì

đo cân nặng ban đầu

đo cân nặng lúc sau

trên cùng 1 đối tượng người béo phì

VD: khảo sát UT phổi có liên quan hút thuốc lá

lấy 1 người nam 60 tuổi bị UT phổi

cũng phải lấy 1 người nam 60 tuổi bình thường

VD: sự khác nhau của trung bình điểm số ở SV Y1

trung bình môn hóa

trùng bình môn toán

TH1: n1 >= 30, n2 >= 30

z5449125725509_60be23a692759fa5b2f74c7ec27e03b6

tử

hiệu số 2 trung bình của 2 nhóm

mẫu có

độ lệch chuẩn bình phương của nhóm 1 chia tổng số quan sát của nhóm 1 = (sai số chuẩn)^2

TH2: n1 < 30 hoặc n2 < 30

z5449178454885_1b8b2665d3989e7316645393316a6e63

z5449178454864_761da2cf639152632e05c41029b5b3c0

xác định vị trí của t ở độ tự do = n1 + n2 -2

(dùng biểu thức đầu tiên)

độ tự do ∞

có thể đánh giá nhanh bằng cách

xem xét cỡ mẫu rất lớn (>100, >500)

lấy độ lệch chuẩn/trung bình <50%

khả năng rất cao phân phối này là phân phối bình thường

đánh giá có đồng nhất hay không?

vd: phương sai điểm trung bình cuộc sống ở nhóm nam có tương tự nhóm nữ hay không?

tiến hành kiểm định cho phương sai, cho giả thiết H0: phương sai là như nhau

dùng Levene's Test

quan sát giá trị sig.

quan sát giá trị sig. (2-tailed) = p

so sánh p với α=0.05

z5461796652156_33269edf512a02d121c6cad51294ddb1

x(tb): giá trị ta quan sát được trong nghiên cứu của ta

μ: giá trị có trước từ nghiên cứu trước (giá trị có sẵn từ trong biến số)

độ lệch chuẩn/căn(n)=sai số chuẩn

nếu n >= 30, XĐ vị trí của t ở độ tự do = ∞

nếu t < 30, XĐ vị trí của t ở độ tự do = n-1

dùng Analyze\Compare means\One sample t-test

nếu p (tức sig. (2-tailed) rất nhỏ thì ghi p < 0.001 (trình bày trên văn bản)

z5461931735263_ed1b7266d938dcf490800dec10a0073f

d (difference): hiệu số trước trừ sau hoặc sau trừ trước của 1 biến số (nhưng phải thống nhất)

nếu n >= 30, XĐ vị trí của t ở độ tự do = ∞

nếu n < 30, XĐ vị trí của t ở độ tự do = n - 1

giá trị d dù âm hay dương cũng phải giữ nguyên

d (tb) là trung bình của các giá trị d, khi áp CT nếu d âm thì ta dùng trị tuyệt đối

dùng Analyze\Compare means\Paired sample t-test

kiến thức cần nhớ

độ lệch chuẩn

standard deviation (Std.Deviation)

sai số chuẩn

standard error mean (Std.Error Mean)

nếu không thỏa điều kiện phân phối bình thường

dùng test phi tham số

U Mann Whitney

nếu không thỏa điều kiện phân phối bình thường

dùng test phi tham số

Wilcoxon

nếu không thỏa điều kiện phân phối bình thường

dùng test phi tham số

Wilcoxon

là kiểm định phi tham số

so sánh phân phối của dữ liệu mẫu với một dữ liệu có sẵn

so sánh 2 bộ dữ liệu khác nhau

kiểm định chi bình phương dùng để

kiểm định dựa trên số đếm

kiểm định xem có sự khác biệt giữa tần số quan sát với tần số lý thuyết do ngẫu nhiên hay không?

tần số quan sát: đếm bao nhiêu cá thể trong từng mẫu nghiên cứu trong từng phân nhóm của biến số

tần số lí thuyết (tần số dự kiến)?

nhóm nữ bao nhiêu người bệnh?

nhóm nam bao nhiêu người bệnh?

các dạng bài

so sánh 1 tỷ lệ quan sát với 1 tỷ lệ cho trước

các bước thực hiện

bước 1: đặt giả thiết H0

bước 2: lập bảng tần số lí thuyết và tần số quan sát

bước 3: tính giá trị chi bình phương theo công thức tổng quát

z5462190542352_085f513f8a5a59d087cffc05293965c4

Q: quan sát (Observation)

L: lí thuyết = mong đợi (Expected)

với bài toán 2 tỷ lệ bất kể n bao nhiêu

ta luôn dò bảng ở độ tự do =1

dùng Analyze\Nonparametric tests\chi-square

so sánh 2 tỷ lệ ở 2 mẫu độc lập

dùng Analyze\Descriptive statistics\Crosstabs

các bước thực hiện

bước 1: đặt giả thiết H0

bước 2: lập bảng 2x2

bước 3: tính giá trị \chi^2

z5462299897470_bbcf893d1fc5b81e66932d5da7498f46

z5462276884411_70e8aeaace157c2b94acaddf65afd051

z5462350297164_afd196049cce8c8c59885ca9319009d2

z5462359447129_c33b4bc9c3b7367c4e1b0fc819005e96

so sánh 2 tỷ lệ bắt cặp

dùng Analyze\Descriptive statistics\Crostabs...

có thể dùng

chi bình phương

chi bình phương Pearson (các tần số lí thuyết đều phải > 5)

Fisher's Exact Test (có 1 hay vài tần số lí thuyết nào đó < 5)

McNemar test

kiểm tra kiến thức lại từ 1h21m44s