简单随机抽样(SRS)
估计
样本量的确定
抽取原则
定义
实施方法
优缺点
构建抽样框,直接进行抽样
将总体中的单元依次从1到N进行编号,然后利用抽签法或随机数法来进行简单随机抽样。
优点
缺点
简单直观。在抽样框完整时,可以直接从中抽选样本,由于抽选的概率相同,用样本统计量对目标量进行估计及计算抽样误差都比较方便。
它要求将包括所有总体单元的名单作为抽样框,当N很大时,构造这样的抽样框并不容易;根据这种方法抽出的单元很分散,给实施调查增加了困难;这种方法没有利用其他辅助信息以提高估计的效率。
简单估计
比率估计
每个抽样单元被抽中的概率都是已知或实现确定的,或者事先可以计算出来。
每个抽样单元被抽中的概率都相等。
按随机原则取样,在取样时排除任何主观因素选择抽样单元,避免任何先入为主的倾向性,防止出现系统误差。
辅助标志特点
辅助变量的信息质量更好,或信息更容易取得即调查成本更低
辅助变量与主要变量之间的相关关系整体上相当稳定
辅助变量的总体必须是已知的,或者是容易获得的
辅助变量必须与主要变量高度相关
确定抽样方式,并根据不同的抽样方式的设计效应对样本量进行调整。
判定有效回答率,并根据有效回答率对样本量进行调整。
根据给定估计精度水平和总体方差的预估,同时考虑总体规模的大小,以简单随机抽样方式及回答率100%为两个前提条件计算出初始样本量。
在需要得到分组数据并对这些分组数据的精度有事先约定或要求时,分别计算各组样本量,然后累计加总得到总体所需样本量。
按照保守原则,对总体方差进行预估。
最后仔细权衡费用、时间、调查机构拥有或可动用的各种资源等方面,得出最终的样本量。
确定委托机构所要求或者认可的估计精度水平,包括误差限度和置信度
点估计
区间估计
优点
缺点
定义
直接以一个样本估计值来估计总体参数
简单,不必知道总体分布
非最优可能
没有给出估计误差
没有充分利用总体分布函数提供信息
不能给出估计的可靠程度
根据样本统计量以一定可靠程度推断总体参数所在的区间范围