BA

Thống kê mô tả

Bảng tần số

Bảng chéo

Đồ thị

Các đại lượng thống kê mô tả

Bar (biến phân loại/liên tục)

Line

Pie

Scatter

Mean (trung bình)

Median (trung vị)

Mode (xuất hiện nhiều nhất)

Variance (phương sai)

Standard deviation (độ lệch chuẩn)

Vị trí chính giữa/Trung bình của 2 vị trí chính giữa

Bình phương độ lệch giữa giá trị của quan sát so với trung bình, tất cả chia cho số quan sát trừ 1 (đơn vị là bình phương)

Căn bậc 2 phương sai

Independent-samples T-test

So sánh trung bình về một chỉ tiêu của 2 nhóm

2 loại biến:

Biến kiểm tra: Biến cần thực hiện so sánh

Biến nhóm: Định nghĩa 2 nhóm cần so sánh

Cần được định nghĩa (define groups)

2 bước:

Levene test: Kiểm định phương sai giữa 2 nhóm có khác biệt không --> Quyết định dùng sig. của hàng nào

T-test: Kiểm tra giá trị trung bình giữa 2 nhóm có sự khác biệt mang ý nghĩa thống kê không --> Kết luận

Paired-samples T-test

Kiểm định sự khác biệt trong trung bình của 2 biến (ghép 1 cặp)
(VD: khác biệt trong trung bình điểm số quiz 1 với quiz 2)

Dùng sig. để biết sự khác biệt có ý nghĩa thống kê không

Biến rời rạc
(VD: giới tính)

Biến liên tục
(VD: điểm số)

ANOVA
(Phân tích phương sai)

So sánh trung bình về một chỉ tiêu của nhiều hơn 2 nhóm

3 bước:

Levene test: Kiểm định phương sai giữa các nhóm có khác biệt không --> Quyết định sử dụng bảng nào

  • Robust Test khi sig. based on mean < 0,05
  • ANOVA khi sig. based on mean > 0,05

So sánh sự khác nhau giữa trung bình các nhóm:

  • Sig. > 0,05: Không có sự khác biệt mang ý nghĩa thống kê trong trung bình về (tiêu chí) giữa ít nhất 2 nhóm đối tượng
  • Sig. < 0,05: Có sự khác biệt mang ý nghĩa thống kê trong trung bình về (tiêu chí) giữa ít nhất 2 nhóm đối tượng

Lập bảng Tukey (Multiple comparisons) để xác định cụ thể nhóm nào có sự khác biệt mang ý nghĩa thống kê:

  • Sig. < 0,05: Giữa 2 nhóm có sự khác biệt có ý nghĩa thống kê
  • Sig. > 0,05: Giữa 2 nhóm không có sự khác biệt có ý nghĩa thống kê

Correlation

Chỉ số thể hiện độ tương quan giữa các biến

Đã được chuẩn hóa nên không còn phụ thuộc vào thang đo gốc của biến

  • -1 < r < 1
  • r = 0 --> Ko tương quan
  • |r| < 0,3 --> Tương quan yếu
  • 0,3 < |r| < 0,49 --> Trung bình
  • |r| > 0,49 --> Mạnh

Đa cộng tuyến (multicollinearity)

Có tương tác rất mạnh giữa 2 biến (|r| > 0,7)

Hậu quả:

  • Dấu của hệ số thay đổi
  • Sig. bị tăng

Kiểm tra đa cộng tuyến trước, rồi mới phân tích hồi quy

Giải pháp:

  • Tách cặp có tương quan mạnh ra, phân tích hồi quy riêng cho từng mô hình
  • Nhiều cặp bị đa cộng tuyến quá thì làm lại mô hình

Hồi quy (Regression)

Tác động của biến độc lập lên biến phụ thuộc/giải thích

Hồi quy tuyến tính đơn: Chỉ có 1 biến độc lập trong mô hình

Hồi quy tuyến tính bội: Có hơn 2 biến độc lập trong mô hình

Đại lượng thống kê trong hồi quy

  • |r|: hệ số tương quan
  • 0 < R^2 < 1: Xác định bao nhiêu % biến thiên của biến phụ thuộc được giải thích bởi các biến độc lập
  • Adjust R^2: Điều chỉnh R^2 theo kích cỡ mẫu và biến độc lập trong mô hình
  • Standard Error

Biến tương tác (Interaction)

Trong hồi quy, 2 biến độc lập có thể tương tác với nhau để gia tăng tác động lên biến phụ thuộc

Biến liên tục (như tuổi) là biến có tác động trực tiếp lên biến phụ thuộc

Biến dummy chỉ có 2 phân loại (như bằng đại học) là biến có tác động điều tiết lên biến phụ thuộc

Muốn nhận xét tác động điều tiết, phải:

  • Tạo biến tương tác
  • Chạy hồi quy cho biến tương tác và 2 biến thành phần
  • Nhận xét riêng hệ số của biến tương tác

Điều tiết tiêu cực: sig. < 0,05 và hệ số âm

Không có tác động điều tiết: sig. > 0,05

Điều tiết tích cực: sig. < 0,05 và hệ số dương