chapter6 簡單相關與回歸分析(3)

五、簡單回歸分析

離均差平方和的分割

決定係數的含義

回歸方程式的建立(pg181)

估計標準誤的含義

理論

預測的問題——根據某個變項預測另一個變項

數學分數用來預測,稱【預測變項】或【自變項】

自然分數被預測,稱【效標變項】或【依變項】

以一個變項來預測另一個變項,稱【簡單回歸分析】

由分析使用的數學函數(回歸方程式)是一次方的,所畫出來的函數線(回歸線或預測線)是直線,稱【直線回歸分析】有【直線模式】之稱

使用【最小平方法】設法找出直線,讓直線能通過構成的重心,有最小的距離。

(一)原始分數回歸方程式

(二)標準分數回歸方程式

公式(pg182)

b斜率:指改變率而言,指的是每增加一個單位的橫軸變項值,相對增加多少單位的縱軸變項值。

a截距:當橫軸變項值0時,回歸線條與縱軸交叉點到原點的距離。

使各個資料點(y)到這條預測線(Y)之平行於Y軸垂直于X軸的距離之平方和變為最小

(pg184)【原始分數回歸公式】或【原始分數預測線】

y預測值,b斜率,a截距

數學分數(x)預測自然分數(y),我們所使用的預測線公式是直線的。

預測的可能範圍僅限於預測變項的值域範圍內,若以範圍的值做預測,可能降低預測結果正確性。因為在值域外,無法保證預測正確性。

可使用標準分數表示;原始分數回歸方程式可轉成標準分數回歸方程式。

公式(185)標準分數回歸係數

使用標準分數回歸方程式,因多個自變項在預測依變項時,誰的預測力大重要性高。

多元回歸分析

使用自變項單位不一致,無法根據原始分數回歸係數來【敦較重要】

多個自變項對一個依變項之回歸分析或預測關係,屬多變量分析。

原始分數回歸係數b之間有密切的關係

斜率會變,但沒有截距

必定通過原點

每個人都會誤以為(y=Y-y),N個人是N個誤差

這三個有關聯

問題

總結來說

當我們以x預測y,我們不知道x的大小,需要對y來做預測,該怎麼辦?

以Y的平均數y來做預估

我們可以平均數y來猜測其預測值Y

總離均差平方和=總變異量(SSt)

殘差值離均差平方和=未被解釋到的變異量(SSres)

sigma(Y-y)2

公式(187)

公式(188 6.9)

若將每個人的猜測的誤差值先予以平方后,加總 sigma(Y-Y)

總離均差平方和=回歸離均差平方和+殘差平方和

總變異量=被解釋到的變異量+未被解釋到的變異量

想瞭解回歸分析預測結果

在自然分數的總變異量中,數學分數所解釋到的變異量部份,約占57%,相關越高越好。

(公式191)(r2)=決定係數

只要決定係數值越大,可被自變項所解釋到的部份越多。

總離均差平方和

(公式 6.30 0個、192)離間係數

公式 6.31 (pg192)

回顧離均差平方和

殘差平方和

在依變項Y的總變異量中,被自變項X所解釋到的變異量百分比。

直接由相關係數平方來計算

SSreg除以SSt來計算

在依變項的總變異量中,無法被自變項解釋到的部份所占的百分比。

只要依變項Y的標準差,和自變項與依變項間的相關係數,便可依據求出SSt、SSreg、SSres。

不偏估計值

等分散性

估計標準誤

一般標準差

測量標準誤

求SSres的最小值

依變項平均數y預測Y所產生的誤差

一般有心理常用的

n-2 分母都減2

依變項呈現常態分配

預測關係是呈現直線的

預測線上所有預測值的殘差值變異數是相等的