Hi,你好。我们紧接上一节的内容接着介绍秩相关。
秩相关又称为等级相关,主要适用于三种情况。
对于数值变量,如果不服从双变量正态分布, 那就不宜作直线相关分析。第二种情况,
对于数值变量,当总体分布类型未知的时候, 我们也不适合作直线相关分析。
第三种情况,对于分类变量,如果它的原始数据 是等级变量,也就是有序分类变量的时候,
也不适合作直线相关分析。这三种情况, 我们就考虑用秩相关或者是等级相关。
最常用的就是Spearman等级相关, 它是基于秩次的非参数相关分析。
样本等级相关系数用rs来表示,
它跟Pearson相关系数小r是很类似的, rs在-1到1之间,rs>0
称为正相关,随着X的增加,Y也是增加的。
X,Y同向变化。rs<0 则意味着X和Y之间是反向变化的,称为负相关。
rs=0说明X和Y是不相关的。
同样,rs的绝对值越接近1,则说明相关程度越密切。
对于Spearman等级相关系数,它的估计公式如下。
在这个公式里边,先把观测值的X、Y
从小到大排秩次,求出 每一对观测值X、Y的秩次之差,为d,
代入公式,n为相应的对子数。
在相同秩次比较多的时候,需要用相应的校正公式,
这个公式比较复杂,我们仅作为一般了解。
同样, 对于Spearman等级相关系数,因为rs
它为样本相关系数,存在着抽样误差,所以 我们也需要检验总体的等级相关系数是否为0。
H0为ρs等于0,H1:ρs不等于0。
对于它的统一检验来说, 如果样本量比较小的话,我们可以直接查表,
对于样本量比较大,比如n>50的时候, 我们可以采用t检验的公式。这个公式看着很眼熟,
它跟pearson相关系数的检验公式是类似的。
用等级相关系数除以相应的标准误,
标准误等于根号下1减rs的平方,除以n-2。
自由度等于n-2。当p值小于等于0.05时,
则拒绝H0,接受H1,认为ρs不等于0, 即X、Y变量之间存在相关性。
同样,在p值小于0.05的前提下, 等级相关系数的绝对值越大,认为两变量之间相关越密切。
我们接着看它的应用。
有两个例子,第一个例子是为探讨硒与大骨节病之间的关系,
分别检测了1990到1998年某地7到12岁儿童中
大骨节病X线阳性率和发硒的平均水平,
试对其进行等级相关分析。X线的阳性率 还有发硒这两个指标
一般都是偏态分布的,我们不能够直接作直线相关分析,需要考虑用Spearman等- 级相关。
第二个例子,492例患者
硅沉着病的不同期次与肺门密度级别资料如下,
试检验二者有无相关。看这个例子,
这个例子,硅沉着病, 492例患者肺门密度的级别可以分成Ⅰ、Ⅱ、Ⅲ级,
硅沉着病的期次可以分成Ⅰ、Ⅱ、Ⅲ期,
这个表格实际上是行变量、列变量均为有序分类变量,
或者行变量、列变量均为等级资料的 一个行乘列表资料,探讨它们二者之间
有无相关,就需要采用Spearman等级相关。
对于这两个例子,我们在下一次SPSS软件操作中 会讲到是如何实现等级相关分析的。
好,今天的内容我们就讲到这,
希望大家掌握Spearman等级相关的应用,掌握 三种情况下可以应用Spearman等级相关。对于数值变量,
当分布为偏态分布,或者分布未知的时候, 可以用Spearman等级相关;对于分类资料,
当行变量、列变量均为等级或者是有序分类变量的时候, 也可以用Spearman等级相关。我们在下一次课
将会介绍SPSS软件的应用,谢谢。