Pearson相关系数要求双变量正态分布,是两个变量均服从正态分布吗?

原创 数据小兵  2020-05-24 22:28  阅读 633 次
视频课程《SPSS统计分析:从入门到实践提高》

两变量的Pearson相关系数有自己的使用条件,要求两个连续变量服从双变量正态分布,也叫做二元正态分布

双变量正态分布?是指两个变量均要服从正态分布吗?

类似的问题比如:请问使用皮尔逊相关系数描述两变量关系时,要求满足X、Y呈双变量正态分布。这里的双变量正态分布是什么意思?是说X和Y都分别满足正态分布么?

【统计咨询】微信公众号撰文列举多部医学统计学教材提到:有一点可以确认的是二元正态分布并不等于两变量均服从正态分布。

此外列举的英文文献中提到:两变量均服从正态分布不一定会服从双变量正态分布。

有意思的是,这篇文章还利用R语言进行抽样测试,分析发现:重复1万次实验,发现服从两变量正态分布的实验中:以P=0.1为界值时,有约11%比例是不服从双变量正态分布的;以P=0.05为界值时,有约6%比例是不服从双变量正态分布的。两者距离我们预设的界值仅有1%之差。

说明什么呢?如果我们为了简便,而把双变量正态分布直接理解“是两个变量均服从正态分布”,这是会犯错误的,当然这个错误并不是特别离谱,宽松来说也是可以接受的。

文章如下↓
双变量正态分布,即两变量均服从正态分布?

现实实践环节,我们在使用Pearson相关系数时,经常是分别检验两个变量是否服从正态来代替双变量正态分布。这种做法虽然有可能犯错误,不过优点是十分地方便。当然我们自然也不能被统计软件(SPSS不能做双变量正态检验)给束缚了,严格地讲,可以考虑使用R语言语法实现双变量正态分布的检验。

除了【统计咨询】号之外,【医咖会】号也讨论过Pearson相关系数的双变量正态性要求,它撰文写到:检验Pearson相关系数的统计学意义要求双变量正态性,但难以评价。

实际操作依赖于双变量正态分布的一个特性,即双变量正态分布存在,则两个连续变量必然都符合正态分布。然而反过来,两个连续变量符合正态分布未必代表双变量正态分布,但能够一定程度上保证双变量正态分布。

小兵以往在相关分析和线性回归分析中,就是直接对两个连续变量分别检验其正态性,今天开始我们SPSS公众号所有的读者,读完这篇文章呢,希望大家做到心中有数,有SAS和R条件的就严格一些,用SPSS软件如果只图方便,且自己的研究也能接受的话,分别讨论两个变量的正态性代替双变量正态性也无不可。

本文完
由数据小兵编辑整理

推荐阅读


数据小兵坚持写博客已经12年
坚持写微信公号文章6年
坚持更新SPSS视频课程2年
坚持一对一答疑讨论2年
欢迎加入SPSS视频课程
竭诚服务
《SPSS统计分析:从入门到实践提高》

视频地址:

https://study.163.com/course/introduction/1003945001.htm?share=1&shareId=1149679450

本文地址:http://www.datasoldier.net/archives/2182
版权声明:本文为原创文章,版权归 数据小兵 所有,欢迎分享本文,转载请保留出处!
SPSS在线视频学习
欢迎订阅SPSS训练营微信公众号

评论已关闭!