定量资料的统计描述

频数分布
(3个概念)

频数图(直方图)

统计描述

频数表步骤

求组距i

确定组限

根据样本含量,求组段数(一般在5-15)K

列表(组段,频数f,频率P,累计频数,累计频率)

求全距(极差)R

下限L,上限U

遵循原则

集中趋势

离散趋势(变异程度)

频率密度

类型

对称分布

非对称分布

正态分布

非正态分布

尖峭峰

平阔峰

正偏态(右偏态)

负偏态(左偏态)

双峰或多峰

平均数(作用)

算数平均数

几何平均数G

中位数

应用:倍数关系或对数关系的偏态分布

注意

计算:直接计算法和加权计算法

应用:正态分布

计算公式

应用:偏态分布或开口资料或不明资料

计算

直接计算法

百分位数法(频数表中寻找中位数)

不拘分布或分布类型不明

对称分布尤其正态分布

极差R(局限性)

四分位间距数Q(与中位数配套使用)

方差S^2(自由度)

标准差S(除描述变异度外,还有哪些运用)

变异系数CV:
标准差与均数之比

度量单位不同的资料

均数差别悬殊的资料

正态分布
(高斯分布)

曲线

纵坐标:概率密度

频数分布直方图样本量扩大的极限情况

变量是总体均数和总体方差

标准正态分布

与正态分布之间的转换

区别于联系

特征

集中性,对称性,均匀变动性

曲线两端永不与横轴相交

单峰分布:高峰为均数

均数影响位置(左右);方差影响形态(越小越陡)

面积分布规律

下侧累计面积:标准差对应的概率

平均数周围95%的总体样本在均数+-1.96个标准差的范围内

应用

质量控制图

其他统计方法的理论基础

确定参考值范围

正态分布

偏态分布
百分位数法

确定单侧还是双侧

确定适宜的百分介值

选择样本量足够大的正常人(同质性)

选择正确的方法进行参考值计算