CHƯƠNG 6: KHOẢNG TIN CẬY
MỞ ĐẦU
Sự thật không thể quan sát trong QT
lấy ra Mẫu (quan sát được)
THỐNG KÊ
THỐNG KÊ MÔ TẢ
THỐNG KÊ PHÂN TÍCH
ƯỚC LƯỢNG
KIỂM ĐỊNH GIẢ THUYẾT
Dự đoán cho dân số (QT)
Phân loại
Ước lượng khoảng
Ước lượng điểm
Mục tiêu
Làm thế nào chúng ta có thể sử dụng dữ liệu tính từ mẫu để ước tính các giá trị của các tham số trong dân số?
ƯỚC LƯỢNG
ƯỚC LƯỢNG ĐIỂM
Là cách thức tính toán 1 gtri thống kê đơn lẻ trong mẫu nghiên cứu
Các gtri tính từ mẫu nghiên cứu được gọi là ước lượng điểm cho tham số dân số
=> Ước lượng cho tham số dân số
Từ TB, phương sai, độ lệch chuẩn, tỉ lệ bệnh tính trong mẫu => ước lượng các gtri ấy của QT, dân số
Các gtri ước lượng có thể bằng hoặc không so với các gtri đặc trưng của quần thể
NGUYÊN NHÂN: Sai lệch trong quá trình chọn mẫu và/ hoặc biến thiên trong sinh học
ƯỚC LƯỢNG KHOẢNG
Là cách thức tính toán 2 gtri trong mẫu nghiên cứu => tạo ra một khoảng được kỳ vọng chứa tham số của dân số
Được xây dựng để khi lấy mẫu lặp lại nhiều lần thì một tỷ lệ lớn các khoảng này sẽ chứa tham số của dân số
Tỷ lệ này là hệ số tin cậy (confidence coefficient)
Khoảng được tạo ra được gọi là KHOẢNG TIN CẬY (confidence interval)
Phân biệt khoảng giới hạn sinh lý bình thường & độ lệch chuẩn (xây dựng trong thống kê mô tả) và khoảng tin cậy & sai số chuẩn (xây dựng trong thống kê phân tích)
Là khoảng bao nhiêu % mà ta tin rằng sẽ chứa tham số của dân số ta quan tâm
Công thức chung:
Khoảng tin cậy = Ước lượng điểm +- (Giá trị tới hạn)*(Sai số chuẩn)
trong công thức chỉ có sai số chuẩn là khác biệt tùy theo con số ta ước lượng, còn ước lượng điểm là tính trong thực tế nghiên cứu và giá trị tới hạn dò trong bảng số đã tính sẵn
SAI SỐ CHUẨN
cho biết ước tính trong mẫu nghiên cứu của chúng ta tốt như thế nào
KHOẢNG TIN CẬY CỦA SỐ TB
KTC = TB +- t * sai số chuẩn
Điều kiện:
với:
Sai số chuẩn = s/căn n
n: số trường hợp khảo sát
s: độ lệch chuẩn của mẫu khảo sát
t: trị số tới hạn, dò bảng t trang 226
Khúc này cô giảng cái gì á, em nghe cũng không hiểu lắm :)). Đại loại là thực hiện khảo sát 1000 lần ở các mẫu khác nhau rồi tính giá trị trung bình các lần xếp lên biểu đồ thì ra phân phối bình thường xong tính được giá trị trung bình của các giá trị trung bình ở trên. Từ đó suy ra được công thức khoảng tin cậy của số TB =)))))
Mẫu nghiên cứu được chọn ngẫu nhiên
Các giá trị phải có phân phối bình thường
Các cá thể trong mẫu nghiên cứu độc lập nhau
KHOẢNG TIN CẬY CỦA TỈ LỆ
KTC = p +- t*sai số chuẩn
Điều kiện:
Sai số chuẩn = (căn p.q/n)
với:
q: tỷ lệ không mắc bệnh
n: số TH khảo sát
p: tỷ lệ mắc bệnh
t: trị số tới hạn, dò bảng t trang 226
Mẫu nghiên cứu được chọn ngẫu nhiên
np >= 5 và n(1-p) >=5
Các cá thể trong mẫu nghiên cứu độc lập nhau
Điều kiện để phân phối nhị giá bằng với phân phối bình thường
Cách xác định t
Bước 1: xác định Alpha
Bước 3: xác định t
Bước 2: xác định độ tự do
Alpha = 100 - KTC yêu cầu
VD: Nếu KTC 95% => alpha = 0.01
Nếu n >= 30 => đtd là vô cùng
Nếu n < 30 => đtd = n-1
Dò bảng t ở độ tự do và alpha vừa tìm (Lưu ý: không được làm tròn t)
Nhớ t = 1.96 với KTC 95% và n >30
dễ nhầm với độ lệch chuẩn
Độ lệch chuẩn nói về phân bố,
hoặc là của một mẫu hoặc là một quần thể
Sai số chuẩn nói về một ước tính
tìm thấy từ một mẫu
VD:
Ước tính về nồng độ đường huyết của dân số có ý nghĩa tốt ntn => dùng sai số chuẩn của giá trị trung bình
Nồng độ đường huyết phân tán ntn => độ lệch chuẩn
YÊU CẦU NHỚ 2 CÔNG THỨC KHOẢNG TIN CẬY VÀ CÁCH XÁC ĐỊNH T
NOTE
Xét một dân số có phân phối bình thường về giá trị của một biến số đang khảo sát, với các giá trị đặc trưng chưa biết
Giá trị tới hạn được xác định dựa vào bảng số thống kê thông qua 2 giá trị ước lượng điểm và hệ số tin cậy
Dùng trong thống kê mô tả
Xuất hiện khi có KTC => Dùng trong thống kê phân tích
Tiến hành chọn mẫu lặp lại 1000 lần, ngẫu nhiên với mỗi mẫu có 16 người (giả lập: không có thật)
=> để tìm ra quy luật gần với thực tế nhất
Ta lần lượt tính được các giá trị trung bình và độ lệch chuẩn cho từng mẫu => thu được 1000 giá trị trung bình và độ lệch chuẩn tương ứng
Các giá trị TB này sẽ có phân phối như thế nào?
Sử dụng định lý
giới hạn trung tâm
Các giá trị trung bình đó sẽ có phân phối bình thường,
gọi là phân phối trung bình mẫu
Giá trị trung tâm
Giá trị phân tán: σ x(ngang) => độ lệch chuẩn của trung bình mẫu => sai số chuẩn
μ x(ngang) = μ
(trung bình của các trung bình) (giá trị trung bình của tham số)
Thực tế: làm 1 lần
tính độ lệch chuẩn -> sai số chuẩn
S=σ/căn(n)
Lưu ý:
Trong QT
Trong mẫu
Độ lệch chuẩn: σ
Số TH khảo sát: n
Độ lệch chuẩn: s
Số TH khảo sát: n-1