参数估计
统计推断(推论统计)
它是一个过程,能从样本数据得出与总体参数有关的结论。
参数估计(估计总体的参数是多少)假设检验(考察总体的参数值是否等于某个感兴趣的值)
样本与总体
总体参数:从理论上可以从整个总体中计算出来的数据,通常希腊字母表示。
总体和样本的关系 ,,, 总体 样本
样本统计量:从样本数据中计算出来的数值,通常26罗马字
抽样误差
测量样本和总体特征近似程度的量数,样本统计量和总体参数之间的差异
运用标准误来描述抽样误差。
点估计
一个用来估计总体参数的数,基本思想是用样本统计量直接作为相应的总体参数的估计值。
好的点估计的标准,无偏估计,有效性,一致性,充分性
常用好的点估计,样本均值,样本标准差
区间估计
优点:简单,易于理解,适用于后续还需要进行计算的条件
缺点:并非总体参数真值,存偏差。无法计算估计值与参数真值的接近程度和可靠程度。
指明一个总体参数所在的区间以及该区间覆盖总体未知参数的概率的估计方法。
置信区间:总体参数的取值范围,即上下限
置信度:该区间覆盖未知的总体参数的概率
区间估计的步骤
click to edit
获得枢轴量与即某理论变量(只与带估计的总体参数有关)
确定枢轴量的范围(一次观测通常不是小概率事件)
确定该估计量的抽样分布
令枢轴量落在大概率事件范围内,反解出未知参数的范围,零此范围即为待估计总体参数的取值范围,即置信区间。
获得一个样本统计量,该统计量应为总体参数的一个好的点估计量
总体均值的估计
标准正态分布
t分布
总体正态或非正态,样本容量大于30,总体方差已知时,适用
总体正态或非正态,样本容量大于30,总体方差未知时,适用
样本统计量为 标准误为
置信区间为
样本统计量为 标准误为
样本均值抽样分布俩影响因素
总体的分类形态
样本的容量大小
正态总体还是非正态。均值抽样分布可能会比总体分布更接近正态
大样本还是小样本
独立组总体均值差异的估计(t分布)
均值差异的方差
枢轴量
总体方差估计
注意
两独立样本,总体为正态分布,且方差相等,总体方差未知
好的估计量
相关组总体均值差异的估计(t分布)
形成一个新的变量D,每个个体在D变量上的取值为前后两次测量的差值。
变量D服从正态分布,因总体方差未知,适用于t分布(df=n-1)进行区间估计。
置信区间的影响因素
置信水平
样本方差
样本容量
大样本的信息量大,置信区间短,统计量距真值更近。
置信水平低,则置信区间短
相同置信度,样本方差大,置信区间越大