目录
在进行数据分析时,经常会遇到需要预测 “是/否” 类型(二分类)的结果:
✔ 这个客户购买产品的概率是多少?(购买 是/否)
✔ 学生是否有可能通过考试?(合格/不合格)
✔ 某人是否有患病风险?(发病 有/无)
这种需要预测 0 或 1 的分类结果时,就需要使用 逻辑回归分析(Logistic Regression)!
虽然逻辑回归与线性回归相似,但逻辑回归的因变量是分类变量(如 Yes/No),而不是连续变量(如分数、销售额)。
🔹 1. 什么是逻辑回归分析?
逻辑回归用于分析自变量(X)对因变量(Y, 是/否)产生的影响。
✔ 自变量示例:年龄、学习时间、营销费用等
✔ 因变量示例:合格/不合格(0/1)、购买/未购买(0/1)
| 比较项目 | 线性回归 | 逻辑回归 |
| 因变量类型 | 连续型(如分数、销售额) | 分类型(如 Yes/No) |
| 输出结果 | 实际值(例如 0~100) | 概率值(0~1) |
| 使用场景 | 广告费用 → 销售额预测 | 市场活动 → 购买概率预测 |
逻辑回归分析中使用 比值比(Odds Ratio, Exp(B)) 来解释变量的影响力!
🔹 2. 如何在 SPSS 中进行逻辑回归分析?
[示例]
我们来分析“学生的学习时间和性别是否会影响考试通过与否”。
📌 1)数据输入
在 SPSS 中如下输入数据:
| ID | 学习时间 (study_hours) | 性别 (gender) | 是否通过 (pass) |
| 1 | 5 | 男(1) | 合格(1) |
| 2 | 3 | 女(2) | 不合格(0) |
| 3 | 6 | 男(1) | 合格(1) |
| 4 | 2 | 女(2) | 不合格(0) |
| 5 | 7 | 男(1) | 合格(1) |
💡 小贴士:
- 类别变量(如性别)需转为数值:男=1,女=2
- 因变量也要使用 0/1 格式表示
📌 2)执行逻辑回归分析
- 点击菜单:[分析] → [回归] → [二项逻辑回归分析(Binary Logistic Regression)]
- 因变量(Y)选择“是否通过(pass)”
- 自变量(X)添加“学习时间(study_hours)”和“性别(gender)”
- 点击[统计] → 勾选“Exp(B)”(比值比)
- 点击[确定],运行分析!
📌 3)结果解读
分析完成后,重点查看 p-value(显著性) 和 Exp(B)(比值比)。
📊 逻辑回归结果示例:
| 变量 | B | S.E | Wald | df | p-value | Exp(B) |
| 学习时间 | 0.8 | 0.2 | 12.5 | 1 | 0.01 | 2.22 |
| 性别(女) | -0.5 | 0.3 | 2.8 | 1 | 0.09 | 0.61 |
💡 解读说明:
- ✅ p < 0.05:表示该变量具有统计显著性(影响显著)
- ✅ Exp(B) > 1:该变量增加时,成功(通过)的概率增加
- ✅ Exp(B) < 1:该变量增加时,成功(通过)的概率降低
✔ 例子中“学习时间”的 p=0.01,Exp(B)=2.22
→ 说明:学习时间每增加1小时,考试通过的概率是原来的 2.22 倍!🎯
🔹 3. 逻辑回归分析小结
| 分析类型 | 适用场景 | 判断标准 | 变量影响解释方式 |
| 线性回归 | 预测连续变量(如成绩) | p < 0.05 | 回归系数B |
| 逻辑回归 | 预测分类变量(如合格) | p < 0.05 | Exp(B):比值比 |
| Exp(B) 解读 | Exp(B) > 1:概率上升 | Exp(B) < 1:概率下降 |
📢 重点总结!
✅ 当因变量是“是/否”时,使用逻辑回归分析
✅ p < 0.05 时,变量影响是显著的
✅ Exp(B) > 1 表示概率增加,Exp(B) < 1 表示概率降低
现在你是不是也觉得逻辑回归分析其实没那么难了呢?😊
请在 SPSS 中亲自操作一次,边实践边学习吧!


