CHƯƠNG 6: KHOẢNG TIN CẬY

MỞ ĐẦU

Sự thật không thể quan sát trong QT

lấy ra Mẫu (quan sát được)

THỐNG KÊ

THỐNG KÊ MÔ TẢ

THỐNG KÊ PHÂN TÍCH

ƯỚC LƯỢNG

KIỂM ĐỊNH GIẢ THUYẾT

Dự đoán cho dân số (QT)

Phân loại

Ước lượng khoảng

Ước lượng điểm

Mục tiêu

Làm thế nào chúng ta có thể sử dụng dữ liệu tính từ mẫu để ước tính các giá trị của các tham số trong dân số?

ƯỚC LƯỢNG

ƯỚC LƯỢNG ĐIỂM

Là cách thức tính toán 1 gtri thống kê đơn lẻ trong mẫu nghiên cứu

Các gtri tính từ mẫu nghiên cứu được gọi là ước lượng điểm cho tham số dân số

=> Ước lượng cho tham số dân số

Từ TB, phương sai, độ lệch chuẩn, tỉ lệ bệnh tính trong mẫu => ước lượng các gtri ấy của QT, dân số

Các gtri ước lượng có thể bằng hoặc không so với các gtri đặc trưng của quần thể

NGUYÊN NHÂN: Sai lệch trong quá trình chọn mẫu và/ hoặc biến thiên trong sinh học

ƯỚC LƯỢNG KHOẢNG

Là cách thức tính toán 2 gtri trong mẫu nghiên cứu => tạo ra một khoảng được kỳ vọng chứa tham số của dân số

Được xây dựng để khi lấy mẫu lặp lại nhiều lần thì một tỷ lệ lớn các khoảng này sẽ chứa tham số của dân số

Tỷ lệ này là hệ số tin cậy (confidence coefficient)

Khoảng được tạo ra được gọi là KHOẢNG TIN CẬY (confidence interval)

Phân biệt khoảng giới hạn sinh lý bình thường & độ lệch chuẩn (xây dựng trong thống kê mô tả) và khoảng tin cậy & sai số chuẩn (xây dựng trong thống kê phân tích)

khoảng bao nhiêu % mà ta tin rằng sẽ chứa tham số của dân số ta quan tâm

Công thức chung:

Khoảng tin cậy = Ước lượng điểm +- (Giá trị tới hạn)*(Sai số chuẩn)

trong công thức chỉ có sai số chuẩn là khác biệt tùy theo con số ta ước lượng, còn ước lượng điểm là tính trong thực tế nghiên cứu và giá trị tới hạn dò trong bảng số đã tính sẵn

SAI SỐ CHUẨN

cho biết ước tính trong mẫu nghiên cứu của chúng ta tốt như thế nào

KHOẢNG TIN CẬY CỦA SỐ TB

KTC = TB +- t * sai số chuẩn

Điều kiện:

với:

Sai số chuẩn = s/căn n

n: số trường hợp khảo sát

s: độ lệch chuẩn của mẫu khảo sát

t: trị số tới hạn, dò bảng t trang 226

Khúc này cô giảng cái gì á, em nghe cũng không hiểu lắm :)). Đại loại là thực hiện khảo sát 1000 lần ở các mẫu khác nhau rồi tính giá trị trung bình các lần xếp lên biểu đồ thì ra phân phối bình thường xong tính được giá trị trung bình của các giá trị trung bình ở trên. Từ đó suy ra được công thức khoảng tin cậy của số TB =)))))

Mẫu nghiên cứu được chọn ngẫu nhiên

Các giá trị phải có phân phối bình thường

Các cá thể trong mẫu nghiên cứu độc lập nhau

KHOẢNG TIN CẬY CỦA TỈ LỆ

KTC = p +- t*sai số chuẩn

Điều kiện:

Sai số chuẩn = (căn p.q/n)

với:

q: tỷ lệ không mắc bệnh

n: số TH khảo sát

p: tỷ lệ mắc bệnh

t: trị số tới hạn, dò bảng t trang 226

Mẫu nghiên cứu được chọn ngẫu nhiên

np >= 5 và n(1-p) >=5

Các cá thể trong mẫu nghiên cứu độc lập nhau

Điều kiện để phân phối nhị giá bằng với phân phối bình thường

Cách xác định t

Bước 1: xác định Alpha

Bước 3: xác định t

Bước 2: xác định độ tự do

Alpha = 100 - KTC yêu cầu

VD: Nếu KTC 95% => alpha = 0.01

Nếu n >= 30 => đtd là vô cùng

Nếu n < 30 => đtd = n-1

Dò bảng t ở độ tự do và alpha vừa tìm (Lưu ý: không được làm tròn t)

Nhớ t = 1.96 với KTC 95% và n >30

dễ nhầm với độ lệch chuẩn

Độ lệch chuẩn nói về phân bố,
hoặc là của một mẫu hoặc là một quần thể

Sai số chuẩn nói về một ước tính
tìm thấy từ một mẫu

VD:

Ước tính về nồng độ đường huyết của dân số có ý nghĩa tốt ntn => dùng sai số chuẩn của giá trị trung bình

Nồng độ đường huyết phân tán ntn => độ lệch chuẩn

YÊU CẦU NHỚ 2 CÔNG THỨC KHOẢNG TIN CẬY VÀ CÁCH XÁC ĐỊNH T

NOTE

Xét một dân số có phân phối bình thường về giá trị của một biến số đang khảo sát, với các giá trị đặc trưng chưa biết

Giá trị tới hạn được xác định dựa vào bảng số thống kê thông qua 2 giá trị ước lượng điểm và hệ số tin cậy

Dùng trong thống kê mô tả

Xuất hiện khi có KTC => Dùng trong thống kê phân tích

Tiến hành chọn mẫu lặp lại 1000 lần, ngẫu nhiên với mỗi mẫu có 16 người (giả lập: không có thật)
=> để tìm ra quy luật gần với thực tế nhất

Ta lần lượt tính được các giá trị trung bình và độ lệch chuẩn cho từng mẫu => thu được 1000 giá trị trung bình và độ lệch chuẩn tương ứng

Các giá trị TB này sẽ có phân phối như thế nào?

Sử dụng định lý
giới hạn trung tâm

Các giá trị trung bình đó sẽ có phân phối bình thường,
gọi là phân phối trung bình mẫu

Giá trị trung tâm

Giá trị phân tán: σ x(ngang) => độ lệch chuẩn của trung bình mẫu => sai số chuẩn

μ x(ngang) = μ
(trung bình của các trung bình) (giá trị trung bình của tham số)

Thực tế: làm 1 lần
tính độ lệch chuẩn -> sai số chuẩn

S=σ/căn(n)

Lưu ý:

Trong QT

Trong mẫu

Độ lệch chuẩn: σ

Số TH khảo sát: n

Độ lệch chuẩn: s

Số TH khảo sát: n-1