非母數檢定
也被稱為分配自由化統計方法(distribution-free methods)。
母體常態假設是很穩健的(robust)假設。
但不能只考慮robust,在檢定力的觀點,若母體明顯非常態,就應該另尋其他檢定力較強的方法,也就是非母數統計方法。
推論對象:
直接推論母體分配型態本身或母體分配位置,而不透過母數。
e.g.資料是否來自於常態。
母體中位數或百分位數是否等於某值。
變數資料型態:
類別變數或等級資料(rank)
所需之前提假設:
所需假設少,分配自由
適用範圍:
要求前提假設少,適用範圍很廣
檢定力:
母體分配不滿足母數方法的假設,使用非母數,檢定力較強
使用時機:
(1)母體非常態,且不能自行假設常態
(2)小樣本
2個條件都滿足,就是使用時機
2個等級相關係數
Spearman's rank correlation coefficient或Spearman's ρ(rho)
pearson相關係數易受到極端值的影響,所以才出現spearman相關係數。把資料X,Y各自內部排序,由小到大給予等級後,再套pearson相關係數公式即可。
有數值相同,就要平分等級
可以進行相關係數是否為0的檢定:
H0:ρ=0 vs Ha :ρ≠0
雙尾檢定,雙尾拒絕
若為小樣本(n≤10),要查Spearman's rank correlation表。
若為大樣本或無表可查,則採t分配近似。
Kendall rank correlation coefficient
做法必須配合題目看,比較容易理解
(1)先把x給予等級,並且由小排到大。
(2)在把x所對應的y資料補上去,並且也轉成等級。
(3)開始算失序量數
(4)最後套公式,即可求出
此種設計方法,算出來的係數必會在[-1,1]之間。
若有資料相同,處理太複雜,在此跳過
單一母體之非母數檢定
兩相依母體之非母數檢定
檢定方法相同
sign test
Wilcoxon signed-rank test
作法:
(1)只能檢定中位數或百分位數
(Ha假說是>,<,≠,都可以)
(2)檢定統計量N(+)或N(-)都可以,習慣上是N(+)(樣本中大於中位數的個數,必須去除tie,也就是跟中位數相同的資料),H0為真,二項分配
(3)小樣本,採p-value法
大樣本,p-value法或檢定統計量常態近似,算RR,2種方法都可以。
matched-pairs sign test
相依母體配對符號檢定
與sign test做法相同
除了N(+)定義為:
所有(Xi,Yi),Xi>Yi之個數
比sign test多考慮了差異的大小
所以改成把差異進行rank
做出來的結果會比sign test好一點
所以2者絕不會是等價檢定
作法:
(1)只能檢定中位數或百分位數
(Ha假說是>,<,≠,都可以)
(2)去除tie後,計算扣掉中位數後的差異Di
(3)Di取絕對值後,由小到大給予rank
(4)算出W(+)(原本差異是正的數的rank的和)和
W(-) (原本差異是負的數的rank的和)
(5)取小的來當檢定統計量(Wilcoxon當初的設計)
(6)因為是取小,所以一律左尾拒絕,雙尾單尾都一樣
(7)需要查Wilcoxon signed-rank test表
注意!!拒絕域是有包含等號的「≦」
(8)當樣本數≧15,就能常態近似,公式要背。
700題才有題目
Wilcoxon matched-pairs signed-rank test
Wilcoxon配對符號等級檢定
與Wilcoxon signed-rank test做法相同
除了差異Di的計算方式改成
Di=Xi-Yi, i=1,2,...,n
多個母體檢定
兩獨立母體檢定
多個獨立母體檢定
多個相依母體檢定
Wilcoxon rank sum test
Mann-Whitney U test
作法:
(1)檢定中位數是否相同或>,<
(2)所有n1+n2筆資料,混合排序,由小到大給予rank(1,2,3...)。(若有相同,就分享rank)
(3)rank完後,會得到2橫行,整列相加即可算出W1,W2
(4)注意!!檢定統計量不是選W1,W2小的,是選2個母體中,樣本數較少的,若樣本數相同,就任挑。
(Wilcoxon當初設計就這樣。 )
(5)此時,雙尾檢定,雙尾拒絕,單尾檢定,單尾拒絕。
(6)小樣本,要查Wilcoxon rank sum test表
(7)大樣本n1≧10,n2≧10,採常態近似,要背公式。
作法:
(1)檢定中位數是否相同或>,<
(2)一樣是混合排序給rank,然後算出W1,W2
(3)將W1,W2,轉成U1,U2,需要背公式
(4)檢定統計量為U1,U2中,挑小的,當初他們是這樣設計
(5)因為是挑小的,所以一律是左尾拒絕,雙尾單尾檢定都一樣
(6)小樣本要查,Mann-Whitney U test表
(7)大樣本採常態近似,建議直接用Wilcoxon的W常態近似公式就好,不用多背一個公式,2者等價檢定
檢定2獨立母體的2種檢定,後人發現2個是等價檢定。
Krystal-Wallis test
作法:
(1)一樣,全部混合排序,給予rank
(2)把每一個處理的rank和做出來
(3)套公式,得到卡方檢定統計量
(4)一律右尾拒絕
是one way ANOVA CRD無母數版本,檢定多個母體,中位數是否相同,不用常態假設,但要同質變異數假設。
使用時機:題目明講使用這個檢定,或不能使用常態假設,或只給卡方表,這些跡象都只能使用無母數檢定,否則通常都是自行假設常態,用ANOVA。
Friedman test
是one way ANOVA RBD無母數版本,代表有區集化,檢定多個母體,中位數是否相同,不用常態假設,但要同質變異數假設。
作法:
(1)比較特別,是在區集內部排序
(2)把每一個處理的rank和做出來,處理是我們主要的研究對象
(3)套公式,得到卡方檢定統計量
(4)一律右尾拒絕
隨機性檢定
runs test
用以檢定一組「成敗序列」的出現順序是否具有隨機性。
H0:序列具有隨機性
Ha:序列不具有隨機性
作法:
(1)先算出「成功或是」的個數和「失敗或否」的個數
(2)計算出runs,意即相同類型的成功或失敗聚在一起,稱為一個run
(3)算出來runs的個數,就是檢定統計量 正常來說,若此序列是隨機的,那麼runs出現的次數,不能太少,也不能太多。
(4)建立假說: H0:序列具有隨機性 Ha:序列不具有隨機性
(5)若有給runs test表,就查表,沒有給,就只能大樣本近似常態,要背公式