统计学回归分析方法应用中的常见问题

原创 数据小兵  2020-01-15 21:38  阅读 246 次
视频课程《问卷数据分析题型拆解与案例实践》

1、线性回归中的奇异值、影响点和共线性问题

(1)很多论文作者是将取得的数据不加分析地放在一起,进行线性回归。很少或没有注意少数奇异值(标准化残差过大,例如大于3)或影响点(标准化残差可能不很大,但对方程影响较大的点)对回归方程影响,可以反复进行回归计算来确定这些点的影响。确定是否要在回归分析时剔除这些比较特殊的点。

统计分析软件SAS和SPSS中的多元线性回归分析都有检测判断影响点和确定影响程度的方法。

(2)许多文章中的多元线性回归方程,往往是将与因变量线性相关的变量均作为回归自变量放在方程中,求出回归方程就认为可以进行预测或根据自变量值求因变量的值了。往往没有考虑到,回归分析要求回归方程中的自变量相互独立,和回归分析还应该分析评价各自变量对因变量的贡献率。

如果回归方程中的自变量彼此存在相关关系,即存在共线性现象,就会给贡献率的评价带来困难。而SAS、SPSS软件都能进行共线性诊断,并能在逐步回归的每一步显示诊断指标。

2、线性回归应用最多,至多到多元线性回归

以至于有些比较陈旧的教科书至今还只介绍二元线性回归。无论自变量与因变量之间是否存在线性关系,甚至不管变量类型,都使用线性回归去探讨预测问题。因而得不出理想的分析结果,甚至错误的结果导致错误的结论。

有了计算机和统计分析软件,以下问题会很容易解决:

(1)在回归自变量量中,某个变量与因变量间是非线性关系,但是这个关系可以用一个明确的表达式表示的,那么可以利用变量代换的方法,将代换变量作为线性回归的自变量求得线性回归方程,然后,再将原来得变量代换回去。

(2)非线性回归、曲线回归在计算机普及得今天都是很容易解决得问题。在统计分析软件中都有成熟得分析过程。例如在SPSS中Regression中的曲线估计、非线性回归。

(3)二分变量或多个分组的分类变量可以作为因变量参与回归分析,这就是近些年来在国内得到普遍应用的逻辑斯特一回归。

回归分析是发展的比较成熟的统计分析方法 , 比较广泛地应用 各领的测工作中。

节选自:

卢纹岱, 朱红兵, 何丽娟, et al. 统计软件应用的常见误区与解决途径[J]. 首都体育学院学报, 2005(01):127-130.

本文地址:http://www.datasoldier.net/archives/1738
版权声明:本文为原创文章,版权归 数据小兵 所有,欢迎分享本文,转载请保留出处!
SPSS在线视频学习
欢迎订阅SPSS训练营微信公众号

评论已关闭!