白话统计阅读笔记：基于秩次的相关系数-今日头条

当连续资料不满足正态分布时，一般不用Pearson相关系数，而是将连续资料进行排序，基于排序后的秩次进行相关分析，此外，当数据为等级资料时，尽管仍为分类资料，但对等级的赋值是有意义的，此时也相当于秩次，只不过每个等级的例数很多而已，本篇介绍三个基于秩次的相关系数。

Spearman相关系数

该相关系数的思路较为简单，就是求出每个变量各自排序后的秩次，然后以秩次作为变量，计算其Pearson相关系数。

Kendall的τ系数

该系数利用两个变量秩次一致和不一致的对子数，计算当前数据的一致性情况占理想中完全一致性情况的比例，如果所有对子数都一致，则相关系数为1，如果所有对子数都不一致，则此时相关系数为-1。

γ系数

该系数也是利用一致和不一致的对子数来进行计算，前一篇中介绍的Q系数就是γ系数的特例。

如果数据是偏态的连续资料，则选择Spearman相关系数或Kendall相关系数并无太大区别，但实际中由于Spearman相关系数更容易理解，所以使用得呃呃呃更加广泛。

但如果数据是等级资料，由于每个等级都有很多频数，则一般认为Kendall相关系数比Spearman相关系数能够更好地处理问题。

Ref: 《白话统计》冯国双著

白话统计阅读笔记：基于秩次的相关系数