全站文章列表 | 收藏本站 | RSS订阅 SPSS教程|答疑|案例|训练营
SPSS教程看完这7点你还敢说了解相关分析吗?

看完这7点你还敢说了解相关分析吗?
时间:2016年07月27日 | 栏目:SPSS教程 | 评论:0 | 点击: 1340


  • 1、相关 VS. 依赖(dependency)


    两个变量之间如果没有依赖关系(non-dependency),那就是说,相关系数为零了。

    但是,反过来却不一定对,甚至往往不对。零相关,很可能有着很好的依赖关系。

    如图:

    根据上图,x的平方与y是线性的依赖关系,纵轴右边,是负相关;纵轴左边,是正相关。但我们的Pearson相关系数呢?Z-E-R-O!,零,没错的。

    注意哈:我们通常说的相关,是度量两个变量间的线性关系,而捕捉不到两个变量间的非线性关系。


    2、相关可以传递吗?


    假如说,有三个变量,X,Y,Z。如果X与Y是相关的,Y和Z是相关的,那么X与Z是相关的吗?

    数学推导太麻烦了(关键我打公式太麻烦了),所以举个简单的例子吧。

    高考成绩,数学分数与总分相关吧?总分还与英文分数相关吧?可是数学分数与英文分数真的也相关吗?

    如图:

    上图中,如果两个变量的相关系数在A区,那么第三个相关将是正相关。如果两个变量的相关系数出现在B区,那么第三个相关系数将是负相关。但如果出现在圆圈之中,那个可就不好说的啦。。。


    3、Pearson相关系数对异常值敏感吗?


    还记得本号之前发过的一张图片吗?安斯科姆“四重奏”!四张图中,都有0.81的相关系数。

    但是,对于后面两幅图,很明显一个完美的相关,但是却被一个异常值拉低。最后一幅图甚至完全破坏了相关关系,本来是0相关的,却变成了正相关!


    4、因果就意味着相关吗?


    已经有上面三个问题的基础,很多人或许可以得到答案了,NO。因果不一定意味着相关。因为因果产生的很可能是非线性的关系(回忆一下,我们说相关,通常是指线性的关系)。

    如下图,

    是0到12度时水的密度。水的密度会随着温度的改变而改变的,但是呢,却会在水温达到4度时达到最大密度。因此,这并不是一个线性的关系。


    5.相关和简单线性回归


    共同点:

    相关系数的平方与简单线性回归中的决定系数是相同的。

    两者都不说明因果关系。

    不同点:

    线性回归提供斜率(以及截距)信息,而相关分析没有此信息。

    回归可以提供预测值,相关不可以。


    6、Pearson VS. Spearman


    简言之,Pearson相关系数捕捉的是两个变量之间的线性关系;Spearman捕捉的是单调性关系(补脑一下高中学过的单调函数)。

    举例一下,有函数 y = exp(x),即指数函数,单调的哈。

    但是呢,你如果用Pearson来算,会得到一个0.25的相关系数;但你若用Spearman来算,相关系数就是1!

    所以呢,如果你一开始就认为两个变量不是线性的,那你就直接用Spearman。否则,你就先用Pearson,如果Pearson结果太小,就再换Spearman试试。


    7、相关 VS. 协方差


    这个对于非专业人士来说,可能会难理解一点。专业人士,看下公式就好了啦。

    相关系数,其实就是对协方差的一个标准化!标准化之后,就可以将我们的系数控制在 +1 到 -1 之间。协方差乱七八糟的,没法比较呀,标准化之后就不一样啦!


    文/图 小兵精选自微信订阅号【医学统计分析精粹】,欢迎订阅


    同类荐读:相关分析 

    本文来自:数据小兵博客

    本文地址:http://www.datasoldier.net/post/xiangguan3.html

    版权说明:如非注明,本站文章均为 数据小兵博客 原创,转载请注明出处和附带本文链接。

  • 额 本文暂时没人评论 来添加一个吧

    发表评论

    必填

    选填

    选填

    必填

    ◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。