統計13~15

變異數分析

目的

找到多個平均數的母體是否相同

假設

常態分配

同質性

母體變異數都相同

獨立性假設

ANOVA table

analysis of variance

SSB(=SSTR) SSW(=SSE) SST的關係

平方合

F分配=MSB/MSW

是右尾檢定

做題

0.完成ANOVA

1.假設檢定 Ho Ha

2.test statistics(F值)

3 Critical/P Value (rejection region)

4結論

均方合(=平方合/自由度)

SSB

Nj*(Xj-X)^2

SSW

(Xij-Xj)^2

=Sj^2*(Nj-1)

SST=SSB+SSW

事後比較(多重比較)

Boferroni

計算每兩個樣本之間的信賴區間

信心水準由1-a變成1-a*Cn取2

Sp=MSE^0.5

用SSE的自由度

LSD

把兩個樣本的差與 誤差(E=LSD) 去做比較

跟boferroni基本上很像 差在沒有把a去*Cn取2

若Xd>LSD 則有差

注意 是雙尾檢定

Fisher LSD

用檢定的方法

14

判定係數

SST(總變異)

SSR(可解釋變異)

sum(yhat-ybar)^2

=SST*R^2

SSE (無法解釋變異)

R^2=

解釋

Y的變異*(n-1)

從模型解釋 Y R^2的變動程度

標準誤

Sb1=(MSE/Sxx)*0.5

B1=斜率

=Sxy/Sxx

=SST-SSR

=Syy-b*Sxy

=Syy

信賴區間

CI=Yhat +- t*{MSE[1/n+(x-xbar)^2/Sxx)]}^0.5

預測區間

PI=Yhat +- t*{MSE[1+1/n+(x-xbar)^2/Sxx]}^0.5

判定係數(coefficient of determination)

LSD=t*[MSE(1/n+1/n)]^0.5

觀念

在x點的預測下 信賴區間與預測區間會最窄

殘差

定義

Sum(yi-ybar)^2

sum(yi-yhat)^2

殘差平方和

希望近似常態分配

實際值-預測值

標準差要是一個定值

期望平均數=0

同質性

殘差相互獨立

獨立性

解決:Durbin-Watson檢測

d介於0~4 越靠近2越獨立

15 複線性回歸

修正R^2

R^2=1-MSE/MST