前不久写过一篇文章,说咱们可以利用残差散点图定性观察线性回归中是否存在异方差问题,往前翻翻历史文章目录可以找到。
现在好了,教会了怎么识别异方差问题,结果又引来新的问题,有读者就问我,我的线性回归残差真的是大喇叭型分布,我太难了,我该怎么办?如何解决异方差问题呢?!
01
来个栗子
小兵继续用雇员数据来举例。
我们就想考察刚参加工作的起始工资是否影响现如今的当前工资水平,自变量起始工资,因变量当前工资做线性回归,我们命令SPSS绘制一个标准化的残差散点图以及残差正态PP图。
很不幸,我们看到下面这个残差散点图不太符合等方差性的要求,点的分布不够均匀,呈现出一个【大喇叭】型分布。
再看残差的正态PP图,很多点偏离直线,不符合正态性要求。
综合我们粗糙认为本例数据存在异方差问题。
发现是发现了,可是我们需要解决方案啊!
02
取对数
解决异方差问题的办法不止一个,小兵今天尝试使用一个实现过程简单的易于操作的方案。
原始数据取对数
在实际中,可以通过对数据取对数变换来降低异方差性的影响。具体的原理咱们就不管它了,下面主要看如何具体操作。
首先取对数。我们采用以10为底对数函数来对原始数据进行变换吧。
SPSS中用【转换】→【计算变量】,找到LG10()函数,并分别移入当前工资和起始工资,分别计算出lgx与lgy两个对应的新变量。
03
取对数后回归
重新以lgx与lgy分别做自变量和因变量做线性回归,命令输出残差散点图和QQ图。如下:
残差散点图显示,点的分布区域均匀分散了,喇叭状减弱基本看不到了,在零横线上下无明显规律分布。
PP图显示,相较于转换前,有更多点靠近直线,落在直线上,与直线重合,近似正态分布。
综上,我们对比发现,取对数再进行线性回归,残差等方差性趋于满足,残差大抵上可以认为是符合等方差性要求了。
本例仅用于演示取对数处理异方差问题,其他问题不做讨论。
本文完
文/图=数据小兵
数据小兵坚持写博客已经13年
坚持写微信公号文章7年
坚持更新SPSS视频课程3年
坚持一对一答疑讨论3年
绝对超值:一对一答疑
欢迎加入SPSS视频课程
竭诚服务
视频地址:
https://study.163.com/course/introduction/1003945001.htm?share=1&shareId=1149679450
评论已关闭!