Please enable JavaScript.
Coggle requires JavaScript to display documents.
BUỔI 3 - Coggle Diagram
BUỔI 3
quy trình cần
tạo khung nhập liệu
tiền xử lí dữ liệu
là quen phần mềm thống kê
nạp dữ liệu vào phần mềm
thống kê phân tích và trình bày
thống kê mô tả và trình bày
mô tả 1 biến định tính
giá trị đặc trưng
tần số
tỉ lệ
biểu đồ (trình bày dữ liệu)
Graphs => Chart Builder=>
với biểu đồ tròn (pie/polar)
trục hoành:
biến số cần mô tả (VD: biến học vấn mẹ)
trục tung:
chọn về percentage (ấn vào element properties => vào cửa sổ statistics => chọn percentage => set parameters => apply => close
sau đó OK
để hiện đươc % trên biểu đồ
ấn đúp vào biểu đồ để hiện cửa sổ chart editor => ấn chuột phải và chọn show data labels
không dùng biểu đồ tròn dạng 3D
chỉ dùng khi số lượng các biến số <7
với biểu đồ cột (bar)
dùng khi quá nhiều giá trị
dùng khi các quá trị gần bằng nhau (khó so sánh trên biểu đồ tròn)
trục hoành
: biến số cần mô tả (VD: biến học vấn mẹ)
trục tung
:
count
percentage
vẽ thêm khoảng tin cậy 95%
2 more items...
4 đặc điểm lưu ý khi vẽ biểu đồ tròn
bắt đầu lúc 12h
theo chiều kim đồng hồ 1
ấn đúp vào biểu đồ để hiện cửa sổ chart editor => ấn vào mảnh bất kì trên biểu đồ => chọn Depth and Angle => vào cửa sổ position slices
ở order of slice: chọn Clockwise
ở First slice (clock position): chọn 12:00
giá trị có tỉ lệ lớn nhất phải nằm ở ô đầu tiên
chỉnh sửa ở phần Categories
biến số có giá trị khác phải để cuối cùng
Analyze => Descriptive Statistics => Frequencies
chuyển biến "giới tính" (biến định tính cần mô tả) vào khung Variable => OK
lưu ý
percent: kqua cho ra tỉ lệ tính cho cả những giá trị missing
valid percent
: chỉ cho kqua tỉ lệ từ những ô có giá trị
thi thì đọc kết quả ở đây
cột cuối (sau khi thục hiện mô tả 1 biến định tính), ở cửa sổ Output
thể hiện tỉ lệ cộng dồn theo Valid percent
mô tả 1 biến định lượng
Analyze => Descriptive Statistic => Explore
VD: dựa vào file weight.sav
KTC 95% của giá trị trung bình chiều dài quần thể
kqua: 54.639 - 55
sai số chuẩn của giá trị trung bình chu vi vòng đầu
0.0581
độ lệch chuẩn của chu vi vòng đầu
1.3616
em bé có chiều dài nhỏ nhất
chuyển biến chiều dài (length) qua ô Dependent List => ấn Plots
chọn thêm Histogram, Normality plots with test => continue => OK
kqua: 48
tìm outliers từ
Boxplot
nhấp đúp chuột vào biểu đồ Boxplot
chọn 1 đối tượng cố định sao cho đối tượng đó có khung vàng
nhấn chuột phải => chọn Go to Case
có thể nhầm lẫn giữa "có bao nhiêu giá trị outliers" và "có bao nhiêu đối tượng outliers"
ví dụ như
1
1 more item...
1
1 more item...
2
1 more item...
1
1 more item...
3
1 more item...
nếu muốn tìm các bất phân vị 25, 50 (median), 75 từ biểu đồ
Boxplot
Analyze => Descriptive Statistic => Frequencies
cho biến định lượng cần tìm qua cửa sổ Variable(s)
chọn tiếp Statistics =>
Qualities
=> continue => OK
nhận diện phân phối bình thường/phân phối chuẩn
nếu cỡ mẫu < 30 thì không có phân phối bình thường/phân phối chuẩn
phân phối bình thường hoặc phân phối chuẩn khi
Skewness/Kurtosis (độ lệch/độ nhọn)
nằm trong đoạn -1 đến 1
Komogorov/Shapiro-wilk
p>0.05 (xem Sig ở cả 2 ô)
biểu đồ
histogram
đường cong hình chuông đối xứng
Boxplot
đường trung vị nằm chính giữa và ít outliers
Q-Q plot
giá trị tập trung trên đường thẳng
thỏa 2 trong 3 điều kiện là được
(điều kiện p>0.05 thường không thỏa)
khi có phân phối bình thường, chọn
giá trị trung tâm: trung bình (Mean)
giá trị phân tán: độ lệch chuẩn (Std.Deviation)
khi có phân phối không bình thường, chọn
giá trị trung tâm: trung vị (Median)
giá trị phân tán: khoảng tứ phân vị (IQR = Interquartile Range)
mô tả câu hỏi nhiều lựa chọn
Analyze => Multiple Response => Define Variable Set
cho các biến số vào cửa sổ Variables in Set => chọn Categories (ở cửa sổ Variables Are Coded As), Range: 1, through: "n" - với "n" là số biến số cần mô tả => điền tên chung ở ô Name => add => close
tiếp tục Analyze => Multiple Response => Frequencies
chuyển tên chung vừa đặt qua Table(s) for => OK
lưu ý: cột cuối trong bảng Frequencies không thể hiện tỉ lệ đối tượng/toàn mẫu => thực hiện tính bằng excel
do cột cuối (Percent of Cases) tính theo cỡ mẫu bỏ qua các đối tượng missing
nếu giả sử có 5 bệnh, tính xác suất người bị mắc 2 trong 5 bệnh
trước hết cần tạo biến số đếm (count) để đếm xem mỗi người mắc bao nhiêu bệnh
Transform => Count Values within Case => đặt tên biến số mới (có thể là count) => Define Values
chọn Range:1 - through:5 => continue => OK
sau đó ta thực hiện mô tả biến số count tương tự như mô tả 1 biến định tính
Analyze => Descriptive Statistics => Frequencies
có thể cho kết quả
tỉ lệ người mắc 2 bệnh: 37%
tỉ lê người mắc ít hơn 3 bệnh: 60.1%
tỉ lệ người mắc nhiều hơn 3 bệnh: 13.1%
ý nghĩa của KTC
% ta tin rằng giá trị thật của trung bình (tỷ lệ) của dân số sẽ nằm trong khoảng này