描述統計

資料點的表示方法

相對地位量數

標準分數:直線轉換

定義:將原始分數以在平均數之上或之下幾個標準差來表示

特性:平均=0,變異數與標準差=1

延伸分數:z分數的直線轉換

統稱Z分數
通式:Z=az+b
平均=b,標準差=a,變異數=a^2

標準九分數

平均=5,標準差=2,單位為半個標準差

資料群的表示方法

圖表

NO

bar graph

pie chart

IR

histogram

frequency polygon

stem-leaf plot

分配

意義

高度(次數)

型態

連續

rectangular distribution

leptokurtic&platykurtic distribution

bimodal distribution

symmetrical distribution

U-shaped distribution

J-shaped distribution

集中

Md

O

Mo

N

Me

HM

GM

離散

canter-based

range

分佈指標的計算

動差

統計概論

簡介

意義

蒐集、整理、分析、解釋數字資料

發展史

Galton&Pearson
標準差、相關係數、適合度檢定

Fisher
確實分配、檢定假設、變異數分析

Neyman&Pearson
型II錯誤、檢定力、信賴區間

Wald
逐次抽樣、統計決策理論

分類

目的

假定

nonparametric sta.

設計

hypothesis test

資料與變項

變項形式

continuous

discreete

量化程度

Nominal

Ordinal

Interval

Ratio

變項間關係

DV

IV

Moderator

confounding

covariate

機率與機率分配

機率

名詞定義

樣本空間

事件

條件機率

聯合機率(維度2以上)

乘數定理

排列&組合

古典機率

交集(相乘率)

伯努利&二項分配

Bernoulli trial

binomial distribution

n=∞(>=30,ND)

丟硬幣正面機率的機率分配
平均=p,變異數=pq/n

poisson distribution

p偏離0.5非常多

hypergeometric distribution

抽出不放回

常態分配

特性

偏態係數g1、峰度係數g2皆為0

高度=次數,面積=累積次數

連續分配,平均數為軸對稱

常態化轉換(非直線轉換)

改變平均數和標準差,次序不變

使用時機:資料不為常態分配

改用無母數統計

非直線轉換

正偏態:取平方根

負偏態:取對數

低闊峰:取倒數

高峽峰:取平方

步驟

descriptive sta.

inferential sta.

變項

理論

correlation analysis

bivariate analysis

multivariate analysis

univariate analysis

parametric sta.

exploratory analysis

confirmatory analysis

positively&negatively skewed distribution

離散

binomial distribution

poisson distribution

uniform distribution

面積(累積)

Mediator

全距(N)

四分差Q(NO)

MdAD

MeAD

SS(ANOVA,迴歸)

S^2(信效度)

S(假設考驗)

原點動差

平均動差

一級(Me)

二級(S^2)

四級(峰度指標)

一級(0)

三級(偏態指標)

二級(S^2)

百分等級與百分位數

整體地位量數

離散

分佈指標

集中

Ppr,I,PR(無條件進位)

PR,O,raw(無條件捨去)

只有兩種出相的單次試驗
成功機率:p,失敗機率:q(1-p)

n=1,影響圖形參數:p
p=q=0.5(均等伯努利分配)

n次的均等伯努力試驗
p=q=0.5,影響圖形參數:n
n=1(點二項分配)

丟硬幣正面個數的機率分配
平均=np,變異數=npq

邊緣機率(單維度)

聯集(相加率)

n很大,參數p為0.5

檢測

Q-Q plot(常態機率圖)

chi square JB test

SW

KS