数据思维 入门概念

相关不等于因果

冰淇淋销量增加时溺水事故也增加——但禁止冰淇淋不会减少溺水,夏天的高温才是共同原因。

逻辑统计数据陷阱
左右滑动或点击卡片继续阅读

为什么相关不等于因果?

两个变量同时变化(相关性),不代表一个导致了另一个(因果关系)。这是数据分析中最重要的警示之一。

相关不等于因果2 / 8

三种可能

当 A 和 B 相关时:

1. A 导致 B(因果关系)
2. B 导致 A(反向因果)
3. C 同时导致 A 和 B(混杂因素)

相关不等于因果3 / 8

经典案例

  • 冰淇淋与溺水:正相关,但因果变量是「夏天高温」
  • 鞋码与阅读能力:正相关,因为年龄大的孩子脚也大
  • 鹤与婴儿:欧洲传说送鹤带来婴儿,统计上确实鹤多的年份婴儿多,但其实是建筑活动同时增多了鹤的栖息地和住房(混杂因素)
相关不等于因果4 / 8

如何确认因果?

  • 随机对照实验(RCT)是金标准
  • 控制变量:排除混杂因素
  • 时间先后:原因必须发生在结果之前
  • 机制解释:有合理的因果路径

在社交媒体上看到「X 导致 Y」的新闻标题时,先想想:它们真的有因果关系吗?

相关不等于因果5 / 8

关键数据

相关系数
-1 到 1
0表示无线性相关,1表示完全正相关
因果推断
2021年诺贝尔经济学奖
Card、Angrist、Imbens因因果推断方法论获奖
相关不等于因果6 / 8

来源引用

[1]《因果论》 — 朱迪亚·珀尔
[2]《魔鬼数学》 — 乔丹·埃伦伯格
相关不等于因果7 / 8

知识邻居

相关不等于因果8 / 8