目录
在进行数据分析时,我们经常会遇到类别型数据(例如:性别、地区、是否购买等),
不像数值型数据那样直接能算平均数。
比如以下这些问题:
✔️ 性别(男/女)会影响对产品的偏好吗?
✔️ 吸烟与否和患病率之间有关系吗?
✔️ 广告类型(A/B/C)会影响点击率吗?
当你想要分析这些类别变量(定性变量)之间是否存在关系时,就需要使用
👉 卡方检验(Chi-Square Test)!
这与用于比较平均数的 t 检验或 ANOVA 不同,
卡方检验是通过“频数”来判断两个变量之间是否有关联的!
🔹 1. 什么是卡方检验(Chi-Square Test)?
卡方检验是判断两个类别变量之间是否存在统计显著关系的方法。
简单来说,就是检验这两个变量的关系是否只是偶然,还是有意义的关联!
✅ 原假设(𝐻₀):两个变量没有关系
✅ 备择假设(𝐻₁):两个变量有关系
如果得到的 p 值 < 0.05,就说明:
👉 两个变量之间存在显著关系!🤩
🔹 2. 在 SPSS 中执行卡方检验
[示例] 想分析顾客的性别(男/女)和是否购买产品(是/否)之间是否存在关系。
📌 1) 数据输入
在 SPSS 中,数据应输入如下格式:
| ID | 性别(Gender) | 购买与否(Purchase) |
| 1 | 男 (1) | 是 (1) |
| 2 | 女 (2) | 否 (2) |
| 3 | 男 (1) | 是 (1) |
| 4 | 女 (2) | 是 (1) |
| 5 | 男 (1) | 否 (2) |
| 6 | 女 (2) | 否 (2) |
💡 小贴士:
类别型变量(如性别、购买与否)需要转换为数字输入!
(例如:男=1,女=2;是=1,否=2)
📌 2) 执行卡方检验操作步骤
点击菜单:[分析] → [描述统计] → [交叉表(Crosstabs)]
将“性别”设为行变量,”购买与否”设为列变量
点击右下角的 [统计量] 按钮 → 勾选“卡方(Chi-square)”
点击“确定”运行分析!
📌 3) 结果解释
执行后,你会在输出结果中看到卡方值和对应的 p 值:
| 检验统计量 | 值 | 自由度(df) | p 值 |
| Pearson卡方(χ²) | 4.85 | 1 | 0.028 |
💡 解释方式:
如果 p < 0.05→ 两个变量之间存在显著关系!(说明性别会影响是否购买)
如果 p > 0.05→ 两者之间没有显著关系 😢
✅ 在上述例子中,p = 0.028,说明:性别和购买行为之间存在统计上的显著关系!🎯
🔹 3. 检查期望频数 —— 卡方检验的前提条件
在使用卡方检验时,有个重要前提需要满足:
✔️ 如果期望频数(Expected Count)小于5的格子太多,
卡方检验的结果可能不可靠!
📌 解决方法:
使用 Fisher精确检验(Fisher’s Exact Test)替代或者使用更适合小样本的逻辑回归分析
📌 在 SPSS 中检查期望频数的方法:
在 [交叉表] 对话框中 → 点击 [单元格(Cells)] 按钮
勾选 “期望值(Expected Count)” → 确定
如果有太多小于5的格子,建议勾选 Fisher’s Exact Test 一起运行!
🔹 4. 卡方检验总结 📌
| 分析方法 | 使用场景 | 结果解释方式 |
| 卡方检验(Chi-Square) | 分析两个类别变量之间的关系(如 性别 vs 是否购买) | p < 0.05 → 存在显著关系 |
| Fisher精确检验 | 当样本量小或期望频数<5时使用 | 用于补充卡方检验 |
📢 核心总结!
要分析两个类别型变量之间的关系→ 用卡方检验!
如果 p < 0.05→ 表示变量之间存在统计意义上的关系 🎯
如果某些格子的期望频数小于5→ 使用 Fisher’s Exact Test更稳妥!
现在你是否觉得卡方检验也变得简单了呢?😊
赶快打开 SPSS 自己试试看吧!
有任何不懂的地方,欢迎随时问我!


