哪些情况可以用,哪些情况会变得有风险——清晰判断标准
在做问卷分析时,
你几乎一定会听到这样一句话:
“Likert 量表是序数变量,用平均值可以吗?”
这个问题的答案,
并不是简单的“可以 / 不可以”。
关键不在于用了平均值本身,
而在于在什么情况下用、怎么用。
The Brain 在大量论文审稿与分析支持过程中发现,
平均值不被质疑的情况,
和被导师或审稿人指出问题的情况,
其实界限非常清楚。
1️⃣ 多题项量表时,使用平均值相对安全
当一个概念由多个题项构成,
并被整合为一个总体得分时,
使用平均值的接受度会明显提高。
原因包括:
单个题项的序数属性被弱化
测量误差在平均过程中被平滑
将其近似为连续变量的假设更合理
也就是说,
相比单一题项,多个题项构成的量表使用平均值更有说服力。
2️⃣ 单一题项的平均值,需要非常谨慎解释
单一 Likert 题项的平均值
在形式上经常被使用,
但解释空间非常有限。
高风险情形包括:
强调“非常细微的平均差异”
对 3.2 vs 3.4 这类差距赋予过多意义
在这种情况下,
平均值只能作为参考指标,
而不适合作为核心论据。
3️⃣ 必须检视:量表分值之间是否真的“等距”
使用平均值的前提是:
各分值之间的间距是相等的。
但在现实中,常见问题包括:
“非常同意”与“同意”之间的心理距离
“一般”的理解在不同受访者之间差异很大
如果不同受访者对分值间距的理解并不一致,
那么平均值的解释可靠性就会降低。
在这种情况下,更安全的做法是:
同时呈现比例
分布
中位数
而不是只给出平均值。
4️⃣ 是否使用平均值,取决于分析目的
平均值本身既不是“一定好”,
也不是“一定错”。
相对适合的情形:
比较不同群体的整体趋势
在回归或相关分析中作为因变量
需要特别谨慎的情形:
作为政策或制度判断的直接依据
设定明确的阈值或标准线
分析目的越偏向“精确决策”,
单独使用平均值的风险就越高。
5️⃣ 使用平均值时,必须进行“补充呈现”
最稳妥的做法不是完全不用平均值,
而是在使用平均值的同时进行补充说明。
推荐组合方式:
平均值 + 标准差
平均值 + 应答比例
平均值 + 分布图
这样可以在结构上弥补平均值的局限。
结论:问题不在统计本身,而在解释方式
仅仅因为对 Likert 量表使用了平均值,
论文并不会因此出问题。
真正出问题的时刻是:
对平均值进行过度、精细、超出其承载能力的解释。
安全使用的核心原则总结:
以多题项量表为主
单一题项仅作为辅助指标
清楚意识到“等距假设”的局限
根据分析目的判断是否适用
与分布、比例等指标共同呈现
The Brain 并不是简单地“建议使用”或“建议回避”Likert 平均值,
而是从审稿与答辩可解释性出发,
帮助研究者设计经得起质疑的分析结构。


