简单随机抽样(SRS)

估计

样本量的确定

抽取原则

定义

实施方法

优缺点

构建抽样框,直接进行抽样

将总体中的单元依次从1到N进行编号,然后利用抽签法或随机数法来进行简单随机抽样。

优点

缺点

简单直观。在抽样框完整时,可以直接从中抽选样本,由于抽选的概率相同,用样本统计量对目标量进行估计及计算抽样误差都比较方便。

它要求将包括所有总体单元的名单作为抽样框,当N很大时,构造这样的抽样框并不容易;根据这种方法抽出的单元很分散,给实施调查增加了困难;这种方法没有利用其他辅助信息以提高估计的效率。

简单估计

比率估计

每个抽样单元被抽中的概率都是已知或实现确定的,或者事先可以计算出来。

每个抽样单元被抽中的概率都相等。

按随机原则取样,在取样时排除任何主观因素选择抽样单元,避免任何先入为主的倾向性,防止出现系统误差。

辅助标志特点

辅助变量的信息质量更好,或信息更容易取得即调查成本更低

辅助变量与主要变量之间的相关关系整体上相当稳定

辅助变量的总体必须是已知的,或者是容易获得的

辅助变量必须与主要变量高度相关

确定抽样方式,并根据不同的抽样方式的设计效应对样本量进行调整。

判定有效回答率,并根据有效回答率对样本量进行调整。

根据给定估计精度水平和总体方差的预估,同时考虑总体规模的大小,以简单随机抽样方式及回答率100%为两个前提条件计算出初始样本量。

在需要得到分组数据并对这些分组数据的精度有事先约定或要求时,分别计算各组样本量,然后累计加总得到总体所需样本量。

按照保守原则,对总体方差进行预估。

最后仔细权衡费用、时间、调查机构拥有或可动用的各种资源等方面,得出最终的样本量。

确定委托机构所要求或者认可的估计精度水平,包括误差限度和置信度

点估计

区间估计

优点

缺点

定义

直接以一个样本估计值来估计总体参数

简单,不必知道总体分布

非最优可能

没有给出估计误差

没有充分利用总体分布函数提供信息

不能给出估计的可靠程度

根据样本统计量以一定可靠程度推断总体参数所在的区间范围