练习R语言:CrossTable()函数实现交叉表卡方检验

原创 数据小兵  2022-01-15 11:11  阅读 1,194 次
数据小兵成长记

现有贷款用户违约数据,我想考察学历和违约的关联性,不同学历水平用户他们的违约率有无差别。

加载gmodels包

library(gmodels)

由于是原始数据记录,因此咱们是直接进行统计分析。CrossTable()函数可以直接对原始数据记录进行交叉表创建,以及卡方检验。

CrossTable(bankloan$教育,bankloan$违约,expected = T,format = "SPSS",fisher = T,prop.c = F,prop.t = F,prop.chisq = F)

来看结果:

交叉表。如上所示,给出不同学历人群违约、未违约的频数、百分比比例。关键结果是期望频数T,这个是很重要的,因为交叉表卡方检验的统计结果适用性,要依据这个期望频数来定义。

扩展阅读↓↓

列联表卡方检验的使用条件

卡方检验显著性检验表格。我们这次是要求R直接给出Pearson's Chi-squared,还有Fisher's Exact Test 。大家看交叉表,有20%的期望频数小于5,最小的期望频数T=1.3。再依据上方小兵分享的扩展阅读,卡方检验使用条件,我们谨慎起见,选择读取Fisher's Exact Test。

结论撰写:Fisher精确检验结果显示,不同学历水平用户违约率差异有统计学意(P=0.017),也可以理解为学历对是否违约有一定的关联性关系。

本文完

文/图=数据小兵

更多R统计文章
练习R:单个连续数据的探索性统计可视化函数EDA
练习R:用lm.ridge()做岭回归分析,可惜无法输出R平方
练习R:lm+plot+abline+text四函数绘制线性拟合散点图
练习R:用lm.ridge()做岭回归分析,可惜无法输出R平方
练习R:分类自变量的线性回归
练习R:factor函数为有序分类变量创建值标签
学习R:识别缺失值与将指定数据编码为缺失值
练习R:car包recode函数多分类变量的重新编码
练习R:stepAIC多元逐步回归
练习R:用3d空间图展示多元线性回归模型
练习R:用3d空间图展示多元线性回归模型
练习R:dplyr包arrange函数排序
练习R:DoE.base包生成标准L9-3-4正交表
练习R:正交试验极差分析、方差分析与统计图形
练习R:rsm包设计响应面试验并做数据分析
练习R:interaction.plot()函数绘制交互作用图
练习R:influencePlot()函数发现离群点杠杆点强影响点
练习R:glm()函数连续自变量的二项logistic回归
练习R:spss.get()函数读取SPSS数据集
练习R:lrtest()函数做logistic回归全局显著性检验
练习R:qqnorm+t.test函数配对t检验
练习R:TukeyHSD()+plot()函数实现多重比较森林图
练习R:pwr.t.test()函数实现独立t检验样本量计算
练习R:qcc.overdispersion.test()函数检验等离散性
练习R语言:fa.parallel()与fa()函数实现因子分析
练习R语言:mk.test()函数Mann-kendall趋势检验
练习R语言:t.test()函数单侧t检验案例
练习R:Mann–Whitney非参数检验效应量计算
练习R语言:bruceR包Freq()函数频率百分比统计
本文地址:http://www.datasoldier.net/archives/3475
版权声明:本文为原创文章,版权归 数据小兵 所有,欢迎分享本文,转载请保留出处!
视频课程《SPSS统计分析:从入门到实践提高》
欢迎订阅SPSS训练营微信公众号

评论已关闭!