實驗設計

什麼是實驗?

回归轻率?那回归用来干嘛...

實驗設計

關鍵概念

實驗

追究因果

有相關性,不一定有因果性
“相關研究”與“實驗”的不同

只要是實驗,而且只有在實驗法當中,我們須操弄獨變項,然後測量(觀察)依變項的變化。假若在一個研究工作當中不涉及獨變項的操弄,以及依變項的測量,那麼該研究必定不是使用實驗法。

是用來檢驗:「X是否會影響Y」的假說的手段

实验 需要 实验组、控制组
相关 不用

相关是饶了一大圈因果论

操弄独变项,否则就是相关

目的

基本分類

混淆變項的來源

實驗法的用途在於釐清獨變項與依變項之間的因果關係,實驗設計的目的在於確保我們能作正確的因果關係的推論

外部效度與內部效度的區分

實驗設計旨在提升內部效度(藉由排除其他可能解釋的方式)

效度

外部

內部

你的研究成果能夠外推到現實世界其他案例的程度,通常是在進行抽樣調查時最需注意的重點

外推的(数量少的人要取样,你不可能做普查)

在你研究當中所做的行動X是否造成可觀測的後果Y的程度。為了確認X與Y之間的因果關係,我們必須排除除了X之外,對Y也會造成影響的其他因素

x是造成y的原因
抽丝剥茧地把其他的干扰素排除(独变项:教学法; 因变相干扰:家庭、父母教育、本身的智力发展、城乡、资源...)所以“教学法”是其中的小小的因素
所以你要证明你那小小独变项的作用,所以要控制其他的变项
“实验组”用你新发明的方法
与“控制组”进行对比

取样技术重要

实验设计就是确保其内部效度

外生變項★★★

(Extraneous variables )

指自變項之外一切可能影響到依變項的主客觀因素,例如研究的物理環境、受試者的性別、身體機能、年齡、教育程度、及職業類別和社經水準等可以辨認的因素均屬之。外生變項對依變項的影響可分為系統性影響與隨機影響兩類。

除了你关心的变项的,其他一切可能影响到的都是

★★★随机的影响★★★
随机的,不可预测的
eg. 教室

★★★系统性的影响★★★
规律的作用力

★★★混淆變項★★★

Confounding Variable
REMOVE

外生變項中屬於會系統性,而非隨機性地影響依變項者,稱之為混淆變項,混淆變項是威脅一個研究之內部效度之最主要因子

混淆内部效度的最主要原因
实验设计最想要排除的

评估的重要标准★★★

uploaded image

社會性因素

單一群組之因素

(single group threats)

uploaded image

(social threats to internal validity)

實驗操弄的擴散或模仿效應(Diffusion or Imitation of Treatment)

eg很多药厂作弊,不用吃也会自己恢复

多元群組之因素

( multiple group threats)

最重要的就是控制組與實驗組的各種條件無法保證完全相同的問題:selection bias


技術上,取得各項條件完全等同的控制組與實驗組是不可能的,我們所能努力的是讓兩組成為「可(公平)比較的」( comparable )

无法做到完完全全一样
追求“公平”(被设为哪一个组的机会是公平的)comparable
而非却对的match

基於競爭心的勤能補拙效應(Compensatory Rivalry)


基於不爽的擺爛心態(Resentful Demoralization)

受試者以外人員的追求公平之補償效應(Compensatory Equalization of Treatment)

獨立群組設計

(Independent Groups Design)

(亦稱受試者間設計:between-participants design)

重複測量設計

(多)因子設計

(亦稱受試者內設計: within-participants design)

(Repeated Measures Design)

(Factorial Design)

X treatment (实验组)
O observation

uploaded image

C 故意不平等,
既定的门槛删选

uploaded image

随机指派是最重要的

實驗法與其他相似類型方法的區別
是否是随机指派的

uploaded image

准实验法 95% 社会科学 看起来像是实验
quasi-experiment

幾個範例

uploaded image

研究就是资料收集、观测

还要再听再理解

獨立群組設計
受试者间

uploaded image

uploaded image

最簡單的重複測量設計形式

uploaded image

受試者內設計的優點

在受試者人數相同的條件下,其結果的統計檢定力較高(beta error 亦降低,日後再交代)

降低實驗誤差中來自各別差異的變異之貢獻
(白話文:受各別差異的影響程度較小)

對於受試者的使用方式之效率較高
(需要的受試者人數較少)


缺點

Practice Effects

Sensitization

Carryover Effects (e.g. fatigue)

Pre-Practice Effects

克服缺點的方法

Counterbalancing

Randomization

依变项多于一个

听不懂QQQQQQQQQQQQ

uploaded image

我们关心的因子作为x轴

两个独变项x1x2 都对依变项y
x2会受到x1影响的话
就说x1x2有交互作用

平行 没有影响 没有交互作用
有交叉 就代表他们之间有作用

有時候現實條件不允許採取實驗法

倫理上的考量
實際面上的考量
技術上不可能達成
仍在研究的非常早期階段,尚不能提出假說
現象、個案數量太稀少
成本過高

The Regression-Discontinuity Design

uploaded image

C indicates that groups are assigned by means of a cutoff score, an O stands for the administration of a measure to a group, an X depicts the implementation of a program, and each group is described on a single line (i.e., program group on top, control group on the bottom).

人道、资源的考量
就不会随机分配
就要用不同的分析方式

例子

前后不共线就代表有效了

uploaded image

uploaded image

相關法

相關是探討變項之間的關係的技術
然而相關係數的高低無法作為兩變項之間有無因果關係的憑據

優點

非常具有彈性

可以回收舊資料


可以發展成相當複雜的分析技術

缺點

B causes A

C causes A and B

無法區辨以下幾種情況:
A causes B


個案研究

優勢

缺點

可揭示除了採用此法之外無法得到的個別差異資料

可以深入,並採取比較統整性(holistic)的觀點

若該個案屬於獨特稀有的情況

結論難以推論到其他個案


除非屬於醫學領域,否則這類研究的發表較為困難

交互作用一定会在期中考

統計

相似性或是向異性舉證

回歸輕率地認定因果