Please enable JavaScript.
Coggle requires JavaScript to display documents.
《爱上统计学》statistics:整理和分析资料并使得资料更容易理解的科学——使研究任务可行 (检验方法 (独立样本t检验…
《爱上统计学》statistics:整理和分析资料并使得资料更容易理解的科学——使研究任务可行
怎样描述数据(数据分布特征)
平均值average: measures of central tendency
均值mean
对极值非常敏感
中位数median
对极值不敏感
众数mode
如果一组数据出现多个众数,这个数据分布就是多峰分布的
变异性:每个数值和特定值(均值)的差异程度
极差range
标准差standard deviation
为什么除以(n-1)而不是n?无偏估计(用样本估计总体):算出的标准差比实际值大,“如果不得不出错,出错也是由于高估了整体的标准差”
当样本量约接近总体规模时,有偏估计(/n)和无偏估计(/(n-1)))的差异就越小
标准差对极值也非常敏感
方差variance
标准差的平方
很难用于解释一组数据
是很多统计方法实际应用的变异性量数
统计学是什么
描述统计(descriptive statistics)
用于整理、描述所收集的数据(data set/data)
推论统计(inferential statistics)
通常是数据收集和汇总的下一步:用较小的群体数据来推论较大群体的特征
如何表示数据特征(数据可视化)
频数分布frequency distribution
选择一个合适的组距,使得10~20个这样的组距就可以覆盖所有的数据
直方图
y-axis:频数
x-axis:每个bar是一个点,宽度是组距,中点是组中值
频数多边形图frequency polygon
在直方图的条形顶端设置组中值,把它们连起来
累积频数分布 camulative frequency diseribution
描述数据的分布
平均值
变异性
偏度(倾斜度)skewness
正偏度分布
均值大于中位数
负偏度分布
均值小于中位数
峰度kurtosis
描述数据分布看起来是扁平(更分散)还是陡峭(变异性更小)
柱形图
比较不同分类的频数
x:分类项
y:频数/数值
条形图
x:频数/数值
y:分类项
线图
表示数据的趋势
饼图
表示组成一系列数据点的项目的比例
相关分析
相关系数correlation coefficient
反映两个变量之间线性相关的数值,[-1,+1]
0-0.2 弱相关/无关
0.2-0.4 弱相关
0.4-0.6 中等强度相关
0.6-0.8 强相关
0.8-1.0 非常强相关
Person product-momentcorrelation皮尔逊相关系数
变量属性
连续
linear correlation
图示表示
散点图scatterplot/scattergram
相关矩阵
有两个以上的变量
每一对变量有一个相关系数
决定系数coefficient of determination
一个变量的方差可以被另一个变量的方差解释的百分比
两个变量共享的特征越多,一个变量可以更多地解释另一个变量表示出的信息
假设检验
用样本推测整体
抽样误差(sampling error)
假设
零假设null hypothesis
宣称两个或多个事物之间是等同的/没有关系的
零假设是研究起点
直到你能证明存在差异,否则你只能假设没有差异
如果存在任何差异,必须假定这些差异是处于偶然
偶然性总是对观察到的群体之间的差异/变量之间的关系的最可能的解释
对应总体
总体不能直接进行检验(不经济也不现实),因此只能间接推论
研究假设research hypothesis
不等价关系假定
无方向研究假定non-directional research hypothesis
有方向研究假设directional research hypothesis
对应样本
能够被直接检验
概率
正态曲线normal curve
三个特征
均值=中位数=众数
中心完全对称
双尾是渐进的(asymptotic)
大样本数据集(n>30),并且重复地从总体中抽取样本时,接近正态分布
基于假设:总体中抽取的样本是正态分布的
z-value
如果数据分布是正态分布,曲线的不同面积可以用标准差或z值的不同数值来表示
这些面积也可以被看做是特定数值出现的概率
如果事件发生的概率是极值(设一个标准,例如0.05),认为不是随机因素导致的,有非概率时间出现(非零假设)
推论统计(显著性差异)
一些基本概念
显著性
两个(或多个)群体之间的差异是由于系统因素的影响而不是偶然因素造成的
显著水平significance level
一定存在一定数量的不能控制的误差(偶然性因素)
显著水平:愿意承担的风险水平或者概率水平/零假设为真的情况下拒绝零假设所要承担的风险水平
I类错误
P<0.05: 有5%所发现的差异不是由于假定的原因而是其他未知原因引起的
统计显著性的重要性
统计显著性本身是无异意义的,处分研究本身有合理的概念基础
统计显著性不能脱离发生的背景独立地解释
虽然是很重要的概念,但不是终极目标,当然也不应该是统计研究的唯一目标
检验方法
独立样本t检验
适用情况
每个参与者只被测试一次
比较两个群体之间的差异
判断两个独立均值是否不同
自由度
近似于样本规模
t检验表:根据自由度和风险水平查找临界值
比较实际值(计算出的t值)和临界值(查表所得)
差异是真实的吗?
效应量effect size越大意味着两个群体重叠的部分越少
ES=(μ1-μ2)/SD
两个相关群体的t检验(非独立均值)/配对样本的t检验/相关样本的t检验
适用情况
比较两个群体之间的差异
每个参与者接收多次测试
方差分析(多个群体)
one way ANOVA
检验两个以上群体在单因素上的均值差异
F=MS(between)/MS(within)
F值大,更可能是随机因素之外的因素的影响
ANOVA & 多元t检验
随着比较的数量(k)增多,犯type I error可能性增大:1-(1-α)k
适用情况
比较多个群体在一个或多个变量上的差异
two way ANOVA
检验多个群体在两个因素上的均值差异
相关系数检验
适用情况
分析两个变量(而不是群体之间)之间的关系
相关不等于因果
线性回归
适用情况
用已经收集到的数据集计算变量如何相关
再适用相关系数以及X的信息估计Y
多元回归multiple regression
非参数检验
适用情况
非正态分布
信度和效度
定义
信度
我怎么知道我每一次使用的检验、量表和工具都能发挥作用?
效度
我怎么知道我每一次使用的检验、量表和工具能够测量出我想测量的内容?
测量尺度
定类 nominal level of measurement
以观察结果的属性特征定义
各个类别相互排斥
定序 ordinal level of measurement
被测量的事物按照属性特征排序
只知道次序1比次序2好,但不知道好多少
定距 interval level of measurement
检验或评估工具是基于某种连续体
尺度上每个间距都相等(可以讨论差多少)
定比 ratio level of measurement
测量尺度中绝对零值存在
信度
observed value= true value+error
信度的类型
再测信度
同一个测试在不同时期是否可信
平行形式的信度
相同测试的不同形式的等价性和相似性
内在一致性信度
测试中的项目是否彼此一致(一个维度/结构/领域)
评分者信度
测量不同评分者对观察结果判断的一致性程度