白话统计阅读笔记:基于秩次的相关系数

当连续资料不满足正态分布时,一般不用Pearson相关系数,而是将连续资料进行排序,基于排序后的秩次进行相关分析,此外,当数据为等级资料时,尽管仍为分类资料,但对等级的赋值是有意义的,此时也相当于秩次,只不过每个等级的例数很多而已,本篇介绍三个基于秩次的相关系数。

Spearman相关系数

该相关系数的思路较为简单,就是求出每个变量各自排序后的秩次,然后以秩次作为变量,计算其Pearson相关系数。

Kendall的τ系数

该系数利用两个变量秩次一致和不一致的对子数,计算当前数据的一致性情况占理想中完全一致性情况的比例,如果所有对子数都一致,则相关系数为1,如果所有对子数都不一致,则此时相关系数为-1。

γ系数

该系数也是利用一致和不一致的对子数来进行计算,前一篇中介绍的Q系数就是γ系数的特例。

如果数据是偏态的连续资料,则选择Spearman相关系数或Kendall相关系数并无太大区别,但实际中由于Spearman相关系数更容易理解,所以使用得呃呃呃更加广泛。

但如果数据是等级资料,由于每个等级都有很多频数,则一般认为Kendall相关系数比Spearman相关系数能够更好地处理问题。

Ref: 《白话统计》 冯国双著

举报
评论 0