目录
一、因果分析概述
1.1 常见逻辑谬误
1.2 因果分析应用
一、因果分析概述
日常工作中,我们经常想用线性回归来看系数是否显著来判断“A的变化是否导致B的变化”,但经常会出现逻辑谬误。
什么时候用因果推断?
treatment(处理) 对于 Y的影响,实验的后续分析:
xx下跌是什么因素影响?
产品业务变动会导致平台生态如何变动?
1.1 常见逻辑谬误
伪关系X和Y恰好同时发生,并无关联。
例:多维分析中无限下探,发现某个人群上效果显著,并没有控制多重检验问题。
两种选择偏差
遗漏变量偏差 没有控制同时影响X和Y的混淆变量(主播的被观看时长跟开播频率之间的关系,忽略了主播本身开播意愿和内容质量这一混淆变量)
幸存者偏差 重要样本因种种原因无法取到 (飞机弹孔机翼上的分布多,加强机翼?)
反向因果
混淆因果Y果X (视频质量越高,用户活跃度越低? 用户活跃度低,观看视频少,质量高)
联立方程
价格X 销量Y是由需求与供给所组成的系统决定的:
X=a1*Y+b1(需求)X=a2*Y+b2(供给)
X与Y之间关系不能代表消费者敏感度a1也不能代表生产者敏感度a2
1.2 因果分析应用
1.效果测评:一个功能有何影响?
2.产品迭代:怎么调整设置,怎么获得反馈产品功能好坏,什么作品作者什么展现形式更好?(单双列)
3.预估长期价值:从什么方向进行优化改进投资。