Please enable JavaScript.
Coggle requires JavaScript to display documents.
计算汇总统计量 - Coggle Diagram
计算汇总统计量
考虑数据类型
中位数适用于顺序型数据
等距或等比数据中位数仍适用,尤其是有极端值
等距或等比数据时,众数可为均值的补充;但通常不使用,除非目的是了解典型个案
一般均值不用于描述称名数据和顺序数据,可以描述等距和等比数据
在处理离散变量时,倾向于众数
众数唯一用于称名测量水平数据的统计量
离散趋势统计量
描述和度量一组数据变异或分散程度统计指标
差异趋势统计量
极差:全距,是变量观察中最大值与最小值的差
四分位数极差:四分位距,删除最小的25%和最大的25%后的极差
方差:离均差平方求和,再除以数据个数。指对时距各种变异总和的测量,具有可加性和可分解性。
标准差:方差的平方根,表示观测值到均值的平均距离的指标
方差和标准差时表示一组数据离散程度的最好指标;
研究中描述统计的规范报告
集中趋势和离散趋势结合;分组进行描述统计;定量与定性结合
标准分数:是原始分数与均值之差,再除以标准差;表示一个分数再团体中所处位置的相对应位置量数。
众数
指观察中出现次数最多的数据,在一个频数分布中,是频数分布最多的数据或数据类别
可以描述类别变量(更适合),也可描述连续变量。优点:对于分类变量,是描述平均数的最好方法,对连续变量的多峰分布很适用;缺点:掩盖的信息比揭示的信息多
中位数
把数据分布恰好等分成两部分的数据,一半大于,一半小于等于。实质就是50百分位数。
奇数个观测值:中间的数
偶数个观测值:中间两个数之和的二分之一
数据的直方图显示数据非对称分布时,常使用中位数
优:很好地代表一组观测值地中点,特别是数据偏科时
缺:对极端数据不敏感
平均值
加权平均数
测量数据单位权重不同时,用以代替平均数
均值
算术平均数,
对极端值敏感;数据中每个数值变化会影响均值;各数据较均值的离差之和为零;均值的离差平方和最小
考虑数据分布形状
单峰对称分布:均值=众数=中数
负偏态分布:均值<中数<众数(正偏态相反)
集中趋势统计量
一种类型的统计指标,描述了数据分布的中心
统计量优缺
优:数据的高度简单化;缺:某些信息丢失
不同类型集中趋势统计量应用条件
差异系数
极端值
:大于或小于均值加减3个标准差的数据