计算汇总统计量

集中趋势统计量

离散趋势统计量

不同类型集中趋势统计量应用条件

研究中描述统计的规范报告

一种类型的统计指标,描述了数据分布的中心

描述和度量一组数据变异或分散程度统计指标

统计量优缺

优:数据的高度简单化;缺:某些信息丢失

众数

中位数

平均值

加权平均数

均值

算术平均数, 样本均值 总体均值

测量数据单位权重不同时,用以代替平均数 加权2

对极端值敏感;数据中每个数值变化会影响均值;各数据较均值的离差之和为零;均值的离差平方和最小 微信图片_20211011234359 微信图片_20211011234404

把数据分布恰好等分成两部分的数据,一半大于,一半小于等于。实质就是50百分位数。

奇数个观测值:中间的数

偶数个观测值:中间两个数之和的二分之一

数据的直方图显示数据非对称分布时,常使用中位数

优:很好地代表一组观测值地中点,特别是数据偏科时

缺:对极端数据不敏感

指观察中出现次数最多的数据,在一个频数分布中,是频数分布最多的数据或数据类别

可以描述类别变量(更适合),也可描述连续变量。优点:对于分类变量,是描述平均数的最好方法,对连续变量的多峰分布很适用;缺点:掩盖的信息比揭示的信息多

考虑数据分布形状

考虑数据类型

中位数适用于顺序型数据

等距或等比数据中位数仍适用,尤其是有极端值

等距或等比数据时,众数可为均值的补充;但通常不使用,除非目的是了解典型个案

一般均值不用于描述称名数据和顺序数据,可以描述等距和等比数据

在处理离散变量时,倾向于众数

众数唯一用于称名测量水平数据的统计量

单峰对称分布:均值=众数=中数

负偏态分布:均值<中数<众数(正偏态相反)

差异趋势统计量

极差:全距,是变量观察中最大值与最小值的差

四分位数极差:四分位距,删除最小的25%和最大的25%后的极差

方差:离均差平方求和,再除以数据个数。指对时距各种变异总和的测量,具有可加性和可分解性。

微信图片_20211012002019 微信图片_20211012002015

标准差:方差的平方根,表示观测值到均值的平均距离的指标 微信图片_20211012002348 微信图片_20211012002352

方差和标准差时表示一组数据离散程度的最好指标;

差异系数 微信图片_20211012003032

极端值:大于或小于均值加减3个标准差的数据

集中趋势和离散趋势结合;分组进行描述统计;定量与定性结合

标准分数:是原始分数与均值之差,再除以标准差;表示一个分数再团体中所处位置的相对应位置量数。