数据思维1 / 8
数据思维 入门概念
相关不等于因果
冰淇淋销量增加时溺水事故也增加——但禁止冰淇淋不会减少溺水,夏天的高温才是共同原因。
逻辑统计数据陷阱
左右滑动或点击卡片继续阅读
为什么相关不等于因果?
两个变量同时变化(相关性),不代表一个导致了另一个(因果关系)。这是数据分析中最重要的警示之一。
相关不等于因果2 / 8
三种可能
当 A 和 B 相关时:
1. A 导致 B(因果关系)
2. B 导致 A(反向因果)
3. C 同时导致 A 和 B(混杂因素)
相关不等于因果3 / 8
经典案例
- 冰淇淋与溺水:正相关,但因果变量是「夏天高温」
- 鞋码与阅读能力:正相关,因为年龄大的孩子脚也大
- 鹤与婴儿:欧洲传说送鹤带来婴儿,统计上确实鹤多的年份婴儿多,但其实是建筑活动同时增多了鹤的栖息地和住房(混杂因素)
相关不等于因果4 / 8
如何确认因果?
- 随机对照实验(RCT)是金标准
- 控制变量:排除混杂因素
- 时间先后:原因必须发生在结果之前
- 机制解释:有合理的因果路径
在社交媒体上看到「X 导致 Y」的新闻标题时,先想想:它们真的有因果关系吗?
相关不等于因果5 / 8
关键数据
相关系数
-1 到 1
0表示无线性相关,1表示完全正相关
因果推断
2021年诺贝尔经济学奖
Card、Angrist、Imbens因因果推断方法论获奖
相关不等于因果6 / 8
来源引用
[1]《因果论》 — 朱迪亚·珀尔
[2]《魔鬼数学》 — 乔丹·埃伦伯格
相关不等于因果7 / 8