TM 11
Korelasi dan Regresi Linier Sederhana
Korelasi
Tujuan
Contoh
Asumsi
Statistik Parametrik
Simbol r
Statistik Nonparametrik
Hubungan antara dua variabel numerik
Besar nilai r sangat berpengaruh terhadap pencilan (outliers)
Scatter Plot
Nama lain: diagram tebar/pencar
Variabel independen (X) = garis horisontal
Variabel dependen (Y) = garis vertikal
Grafik yang menunjukkan titik-titik perpotongan nilai data dari dua variabel (X dan Y)
Derajat keeratan (kuat-lemah)hubungan dilihat dari tebaran datanya.
Makin rapat = makin kuat hubungan
Makin lebar = makin lemah hubungan
Sebelum menghitung koefisien korelasi
untuk melihat secara visual hubungan 2 variabel
Pola hubungan linier (garis lurus)
Asumsi dua variabel numerik mengikuti distribusi normal (bivariate normal)
Subjek penelitian dipilih secara acak (random)
Variasi kedua variabel homogen (homoscedastic)
Mengukur adanya / derajat / kuatnya / arah hubungan antara dua variabel numerik
Apakah ada hubungan antara berat badan bayi saat lahir dengan lingkar lengan atas bayi (LILA)?
Apakah hubungan berat badan dan tekanan darah mempunyai derajat yang kuat atau lemah, apakah kedua variabel tersebut berpola positif atau negatif?
Pearson’s correlation coefficient
Spearman’s (rank) rho dan Kendall’s tau-b correlation coefficient
Spearman’ rho atau Kendall’s tau-b mengukur hubungan antara dua variabel kualitatif atau kuantitatif yang tidak berdistribusi normal (skewed) dan atau adanya pencilan
Gunakan scatter plot
Bila pola hubungan cenderung linier (garis lurus) hitung Koefisien Korelasi Pearson Product Moment (r)
Periksa terlebih dahulu pola hubungan diantara kedua variabel
Bila tidak linier maka besarnya koefisien korelasi Pearson (r) akan memberikan interpretasi yang salah
r = 0 tidak ada hub.linier
r = -1 hub.linier (-) sempurna
r = +1 hub.linier (+) sempurna
Bila kenaikan satu variabel diikuti penurunan variabel lain
Misal: makin tambah umur, makin rendah Hb-nya
Bila kenaikan satu variabel diikuti kenaikan variabel lain
Misal: makin tambah Bbnya, makin tinggi tekanan darahnya
Colton (1974) mengelompokkan nilai r sbb:
r = 0,00 – 0,25 = tidak ada hubungan / lemah
r = 0,26 – 0,50 = hubungan sedang
r = 0,51 – 0,75 = hubungan kuat
r = 0,76 – 1,00 = hubungan sangat kuat
Koefisien Korelasi Pearson
Regresi Linier
Contoh
Tujuan
Asumsi pada regresi linier
Mencari garis terbaik regresi linier
Suatu model matematis yang dapat digunakan untuk mengetahui bentuk hubungan antara dua atau lebih variabel
Persamaan garis regresi linier
Membuat perkiraan (prediksi) nilai suatu variabel (var.dependen) melalui variabel yang lain (var.indepen)
Ingin menghubungkan berat badan dan tekanan darah. Dengan regresi linier = memperkirakan besarnya nilai tekanan darah bila diketahui data berat badan
Nilai Y terdistribusi secara normal untuk setiap nilai X (normality)
Varian Y adan Y adalah tidak saling berkait dalah sama untuk setiap nilai X (homoscedasticity)
Nilai X (independency)
Nilai mean dari Y adalah fungsi garis lurus (linierity) dari X : Yi = a + b1Xi + z
Metoda Least Square (Persamaan garis dibuat sedemikian rupa sehingga jumlah kuadrat dari selisih nilai observasi dengan nilai pada garis adalah minimum)
Y = a+bX + z
Y : variabel dependen
X : variabel independen
a : intercept, perbedaan besarnya nilai variabel Y ketika variabel X=0
b : slope, perkiraan besarnya perubahan nilai variabel Y bila nilai variabel X berubah satu unit pengukuran
e: error , nilai kesalahan, selisih antara nilai Y individual yang teramati dengan nilai Y yang sesungguhnya pada titik X tertentu
Koefisien Determinasi (R^2)
Seberapa jauh variabel independen (X) dapat memprediksi variabel dependen (Y)
Makin besar R square = makin baik / makin tepat var. independen memprediksi var.dependen
Berguna untuk mengetahui seberapa besar variasi variabel dependen (Y) dapat dijelaskan oleh variabel independen (X)
Besarnya nilai R square antara 0 s/d 1 atau 0%-100%
Salsabila Firdausi 2310713054