BA
Thống kê mô tả
Bảng tần số
Bảng chéo
Đồ thị
Các đại lượng thống kê mô tả
Bar (biến phân loại/liên tục)
Line
Pie
Scatter
Mean (trung bình)
Median (trung vị)
Mode (xuất hiện nhiều nhất)
Variance (phương sai)
Standard deviation (độ lệch chuẩn)
Vị trí chính giữa/Trung bình của 2 vị trí chính giữa
Bình phương độ lệch giữa giá trị của quan sát so với trung bình, tất cả chia cho số quan sát trừ 1 (đơn vị là bình phương)
Căn bậc 2 phương sai
Independent-samples T-test
So sánh trung bình về một chỉ tiêu của 2 nhóm
2 loại biến:
Biến kiểm tra: Biến cần thực hiện so sánh
Biến nhóm: Định nghĩa 2 nhóm cần so sánh
Cần được định nghĩa (define groups)
2 bước:
Levene test: Kiểm định phương sai giữa 2 nhóm có khác biệt không --> Quyết định dùng sig. của hàng nào
T-test: Kiểm tra giá trị trung bình giữa 2 nhóm có sự khác biệt mang ý nghĩa thống kê không --> Kết luận
Paired-samples T-test
Kiểm định sự khác biệt trong trung bình của 2 biến (ghép 1 cặp)
(VD: khác biệt trong trung bình điểm số quiz 1 với quiz 2)
Dùng sig. để biết sự khác biệt có ý nghĩa thống kê không
Biến rời rạc
(VD: giới tính)
Biến liên tục
(VD: điểm số)
ANOVA
(Phân tích phương sai)
So sánh trung bình về một chỉ tiêu của nhiều hơn 2 nhóm
3 bước:
Levene test: Kiểm định phương sai giữa các nhóm có khác biệt không --> Quyết định sử dụng bảng nào
- Robust Test khi sig. based on mean < 0,05
- ANOVA khi sig. based on mean > 0,05
So sánh sự khác nhau giữa trung bình các nhóm:
- Sig. > 0,05: Không có sự khác biệt mang ý nghĩa thống kê trong trung bình về (tiêu chí) giữa ít nhất 2 nhóm đối tượng
- Sig. < 0,05: Có sự khác biệt mang ý nghĩa thống kê trong trung bình về (tiêu chí) giữa ít nhất 2 nhóm đối tượng
Lập bảng Tukey (Multiple comparisons) để xác định cụ thể nhóm nào có sự khác biệt mang ý nghĩa thống kê:
- Sig. < 0,05: Giữa 2 nhóm có sự khác biệt có ý nghĩa thống kê
- Sig. > 0,05: Giữa 2 nhóm không có sự khác biệt có ý nghĩa thống kê
Correlation
Chỉ số thể hiện độ tương quan giữa các biến
Đã được chuẩn hóa nên không còn phụ thuộc vào thang đo gốc của biến
- -1 < r < 1
- r = 0 --> Ko tương quan
- |r| < 0,3 --> Tương quan yếu
- 0,3 < |r| < 0,49 --> Trung bình
- |r| > 0,49 --> Mạnh
Đa cộng tuyến (multicollinearity)
Có tương tác rất mạnh giữa 2 biến (|r| > 0,7)
Hậu quả:
- Dấu của hệ số thay đổi
- Sig. bị tăng
Kiểm tra đa cộng tuyến trước, rồi mới phân tích hồi quy
Giải pháp:
- Tách cặp có tương quan mạnh ra, phân tích hồi quy riêng cho từng mô hình
- Nhiều cặp bị đa cộng tuyến quá thì làm lại mô hình
Hồi quy (Regression)
Tác động của biến độc lập lên biến phụ thuộc/giải thích
Hồi quy tuyến tính đơn: Chỉ có 1 biến độc lập trong mô hình
Hồi quy tuyến tính bội: Có hơn 2 biến độc lập trong mô hình
Đại lượng thống kê trong hồi quy
- |r|: hệ số tương quan
- 0 < R^2 < 1: Xác định bao nhiêu % biến thiên của biến phụ thuộc được giải thích bởi các biến độc lập
- Adjust R^2: Điều chỉnh R^2 theo kích cỡ mẫu và biến độc lập trong mô hình
- Standard Error
Biến tương tác (Interaction)
Trong hồi quy, 2 biến độc lập có thể tương tác với nhau để gia tăng tác động lên biến phụ thuộc
Biến liên tục (như tuổi) là biến có tác động trực tiếp lên biến phụ thuộc
Biến dummy chỉ có 2 phân loại (như bằng đại học) là biến có tác động điều tiết lên biến phụ thuộc
Muốn nhận xét tác động điều tiết, phải:
- Tạo biến tương tác
- Chạy hồi quy cho biến tương tác và 2 biến thành phần
- Nhận xét riêng hệ số của biến tương tác
Điều tiết tiêu cực: sig. < 0,05 và hệ số âm
Không có tác động điều tiết: sig. > 0,05
Điều tiết tích cực: sig. < 0,05 và hệ số dương