Please enable JavaScript.
Coggle requires JavaScript to display documents.
Ch13 相關分析與線性回歸(P/P426) - Coggle Diagram
Ch13 相關分析與線性回歸(P/P426)
1 Preview(P/P426)
1-2 探討兩個變數之間的關係(P/P426)
兩個區間或比例尺度變數間的關係(P/P426)
如何用數值測量法表達兩個變數間的關係(P/P427)
關係的強弱(P/P427)
正向或負向關係(P/P427)
用方程式呈現變數間關係(P/P427)
依據方程式以一個變數為基礎估計另一個變數(P/P427)
2 方法(P/P427)
2-1 相關分析(Correlation Analysis)(P/P427)
2-2 Regression Analysis(回歸分析)(P/P427)
建立一個方程式,根據一個變數的值估計另一個變數的值(P/P427)
評估方程式準確估計的能力(P/P427)
1-1 變數(P/P428)
a Independent Variable(獨立變數)(P/P428)
又稱為預測變數(P/P428)
繪製於水平(X)軸(P/P429)
b Dependent Variable(相依變數)(P/P428)
又稱為被預測/估計變數(P/P429)
獨立變數為某數值的結果(P/P429)
相依變數為隨機的(P/P429)
某特定數值的獨立變數,其相依變數有許多可能的結果(P/P429)
繪製於垂直(Y)軸(P/P429)
2-1 Correlation Analysis(相關分析)(P/P427)
適用情境:兩變數間關係的強度(P/P427)
流程(P/P427)
手動
畫散佈圖(P46/P435)
Correlation Coefficient(計算相關係數)(P/P429)
解釋相關係數(P466/P434)
檢定相關係數的顯著性(P470/P437)
檢定樣本的相關性(相關係數)代表母體的相關性(相關係數)
ρ represent the correlation in the population. (pronounced “rho.”)ρ代表母體的相關係數」(P470/P437)
1 more item...
必須謹慎地解釋相關係數(P46/P434)
若兩變數之間有很強的關係,通常會傾向假設其中一個變數X的增減會影響另一個變數Y的變化,但這不表示X的增加會增加Y的數量,有時可能會有Spurious correlation(假相關)的可能。(P46/P434)
發現兩變數之間有強烈的相關時,僅代表兩者之間有關係或關聯,而不代表其中一個變數的變化會導致另一個變數產生變化(P46/P434)
觀察變數之間的關係/趨勢(P/P427)
Excel(P/P427)
TA Class
Correlation Coefficient(相關係數)(P/P429)
相關係數符號:
r
, Pearson's
r
, Pearson product-moment correlation coefficient(皮爾森積差相關係數)(P/P429)
(13-1)(P466/P433)
r=-1~1(P/P430)
r
=-1.00 & 1.00: Perfect Correlation(完全線性正&負相關)(P/P429)
Fig13-2(P/P430)
相關係數的強度與方向(P464/P430)
CHARACTERISTICS OF THE CORRELATION COEFFICIENT(P464/P430)
r
=0 Perfect Correlation(零相關,兩個變數間沒有任何關係)(P/P430)
Fig13-2(P/P430)
r
接近零,兩變數的線性關係很弱(P/P430)
除以(n-1),相關係數就跟樣本大小無關(P466/P433)
功能:兩變數間關係強度的測量結果(判斷兩變數間關係的強度與方向)(P/P427,P429)
定義:建立數值的測量方法以精確地描述兩個變數之間的關係,這套統計技術稱為相關分析(P/P428)
測量了個變數間關係的一套技術(P/P428)
基本概念(P/P428)
找出兩變數之間的關係(P/P428)
藉由繪製資料的散佈圖可看出(P/P428)
2-2 Regression Analysis(回歸分析)(P/P427)
定義:檢查兩變數間的線性關係的方法;為用獨立變數X估計相依變數Y來發展方程式與提供估計的技巧(P474/P441)
Regression Equation(迴歸方程式)(P474/P441)
表達兩變數間線性關係的方程式(P474/P441)
依據X的值估計Y的直線方程式(P474/P441)
(13-3)(P476/P442)
ŷ, read y hat, is the estimated value of the y-variable for a selected x-value. a is the y-intercept.b is the slope of the line.x is any value of the independent variable that is selected.(P476/P442)
(13-4)(P476/P442)
(13-5)(P476/P443)
基本概念(P474/P441)
以方程式表達兩變數間的線性關係(P474/P441)
依據挑選出來獨立變數X的值,估計相依變數Y的值(P474/P441)
Least Squares Principle(最小平方法)(P474/P441)
the best-fitting line(產生最適線)(P474/P441)
定義:利用極小化實際的y值與預測的y值之間垂直差距的平方和,定出一條直線的數學程序(P474/P442)
Chart13-9(P476/P442)
最小平方迴歸線的特徵(P47/P445)
a 這條直線會通過X值平均數與y值平均數的座標點(P47/P445)
沒有其他直線與樣本資料的差距平方和,會比這條最小平方迴歸線來得小(P478/P445)
最小平方回歸方程式所得的值Σ(y − ŷ)2,比其他公式所得到的值更小(P478/P445)
(y − ŷ)(P478/P445)
Residual(殘差)(P478/P445)
誤差值(P478/P445)
實際值與預測值的差距(P478/P445)
適用情境:檢查兩變數間的線性關係(P74/P441)
流程
a 手動
畫散佈圖(P47/P444)
在散佈圖上繪製最小平方迴歸方程式的圖形(P47/P444)
找出迴歸方程式(P478/P445)
檢定斜率的顯著性(P482/P449)
Step 1:建立虛無假設H0( β = 0;β ≤ 0)與對立假設H1(β ≠ 0;β > 0)(P482/P449)
母體迴歸線的斜率不為0,則使用回歸方程式可增加根據獨立變數預測相依變數的能力(P482/P449)
母體迴歸線的斜率(β)為0,則不宜使用回歸方程式根據獨立變數預測相依變數(P482/P449)
β代表母體回歸方程式的斜率;b為樣本回歸方程式的斜率,也是母體斜率的估計值(P482/P449)
Step 2: 選擇顯著水準
1 more item...
b Excel
TA Class
統計軟體算出的P值通常是做雙尾檢定使用(P483/P451)
注意事項:(P47/P444)
沒有在樣本資料範圍內的X,不應用來估計其所對應的Y(P47/P444)
迴歸分析,一定要包含判定係數的陳述(P/P456)
兩變數高度相關,但不一定為線性關係。在解釋相關係數或回歸方程式的結果時,請小心,這些統計量可能顯示沒有線性關係,但可能有某種其他非線性或曲線的關係(P495/P462)
在做結論前仔細檢視散佈圖及繪製的迴歸線(P495/P463)
若為線性,資料點應該散佈在整個獨立變數範圍內迴歸線的上面及下面
(P497/P464)
若非如上數,可考慮藉由轉換其中一個變數,進行資料轉換,把變數間的非線性關係 換成線性關係(P495/P464)
(P497/P464)
2-3 評估回歸方程式的預測能力(P490/P452)
2-3-1 提供回歸方程式預測相依變數的能力(P/P457)
a Standard error of estimate(估計的標準誤)sy∙x(P/P452, 457)
功能:根據X所得的預測值Y有多精確
特定
x
值中
y
的標準誤
特定
x
值下
y
值在迴歸線附近的離散程度(定義:特定
x
值下,迴歸線附近的分散貨離散的量度)
(13-7)(P485/P452)
若估計的標準誤很小,表示資料非常接近回歸線;若若估計的標準誤很大,表示迴歸方程式不能精準估計
y
(P/P453)
b Coefficient of Determination(判定係數)(P/P453)
R-square(R平方)(P/P453)
定義:相依變數
Y
的總變異中,可由獨立變數
X
來解釋的比例(P/P453)
迴歸變異(SSR)佔總變異(SS Total)的百分比(P/P455)
(13-8)(P/P455)
計算:相關係數的平方(P/P453)
轉換成百分比表示(P/P454)
方程式能完美預測,判定係數為100%(P/P454)
和相關係數為+1或-1有關
2-3-2 隨獨立變數的值而定(P/P457)
計算相依變數預測值的信賴區間(P/P457)
必要的迴歸假設前提:(P/P457)
b 這些常態分配的平均數皆落在迴歸線上
c 這些常態分配的標準差都相同,此共同標準差的最佳估計量是估計的標準誤 (sy·x)
a 每個
x
都有其對應的
y
, 且這些
y
依循常態分配
d 在統計上
y
值是獨立的,亦選取樣本時,某
x
值與其他
x
值無關
當資料是在一段時間內所搜集時,這個假設尤其重要
某時間的誤差常常會與其他時間的誤差相關
以圖形表示迴歸假設(P490/P457)
基本概念(P490/P458)
經驗法則(Ch7)(P491/P458)
ŷ ± sy·x 將包含中間約68%的觀測值
ŷ ± 2sy·x 將包含中間約95%的觀測值
ŷ ± 3sy·x 將包含幾乎全部的觀測值
區間估計的類別(P491/P458)
a Confidence Interval(信賴區間)(P491/P458)
適用情境:用於迴歸方程式被用來在特定
x
值下
預測
y
的平均數
時(P491/P458)
特定
x
值下
y
平均數
的信賴區間(13-11)(P491/P458)
b Prediction Interval(預測區間)(P491/P458)
適用情境:用於迴歸方程式被用來在特定
x
值下
預測單一的
y
值
時(P491/P458)
特定
x
值下
y
值
的預測區間(13-12)(P491/P458)
流程(P492/P459)
Step 1 已回歸方程式計算預期的
y
值
Step 2 選擇顯著水準
Step 3確定自由度與查表找到t值
Step 4 依需要將數值帶入信賴區間(13-11)或預測區間(13-12)公式
1 more item...
2-4 Transforming Data(數據的轉換)(P495/P462)
適用情境:兩變數間若非線性關係時(P495/P462)
重新調整一兩個變數,使其為線性關係(P495/P462)
兩個變數取平方根
Reciprocal(倒數)
Log(y)
平方
3 相關係數、判定係數與估計標準誤之間的關係(P/P454)
3-2 相關係數的平方=判定係數(P/P455)
相關係數、判定係數、標準誤放在一起看(P/P456)
估計的標準誤(13-9)(P/P456)
(殘差均方根,MS根)(13-10)(P/P456)
3-1 相關係數與估計標準誤為相反的關係(P/P455)
當兩變數的線性關係強度增加,相關係數會上升,估計標準誤會下降(P/P454)
3-3 總變異(SS Total)可分為(P/P455)
迴歸變異(SSR,判定係數)(P/P455)
由迴歸模型解釋的部分
(13-8)(P/P456)
判定係數與殘差或誤差的平方和為負相關(P/P456)
不能解釋或誤差的變異佔總變異的百分比越高,判定係數越小(P/P456)
誤差或殘差(SSE)
不可解釋的變異(P/P455)
SSE Residual or Error Sum of Squares = SSE = Σ(y − ŷ)2(P/P456)