一文通关ABtest从原理到实操
0、实验原理回顾
【1 】 原假设和备择假设;
备择假设一般是研究者想要收集证据支持的假设,因为建设检验核心用到是小概率反证,所以我们会提出与备择建设对立的假设作为替换假设。
【2】 两类错误
①弃真错误
计算结果落在接受域,而实际结果却在拒绝域;
即原假设是正确的,但我们拒绝了原假设 ,认为实验结果是显著的,错误上线了实验方案;
②取伪错误
计算结果落在拒绝域,而实际结果却在接受域。
原假设不正确,但是没有拒绝认为实验不显著,错过了一个好版本推全量上线机会;
对两类错误上限的选取(α是5%,β是20%),因此对A/B实验背后的思考,业内也有一句广为流传的话,宁肯砍掉4个好的产品,也不应该让1个不好的产品上线。
【3】 概念
检验原理 小概率原理
比如:
在认为总体符合正态分布的时候,两个总体的均值差也是符合正态分布的,所以在统计学的参数估计上会认为,均值差会在一定的置信区间内,并且落在置信区间之外的概率很小,是一个小概率事件,且统计学认为小概率事件在一次实验中是不可能发生的。
因此当最后实验结果发现,样本的均值差真的落在了置信区间之外,也就是拒绝域,我们则有一定置信水平下的把握认为可以拒绝原假设,两个总体均值之间存在显著的差异(实验显著)。
反证法对原假设做出非对即错的判断,本质上是判断是,样本和总体的差是抽样的误差引起的,还是总体的差异带来的。
p 值
在假设检验中,虽然不能但是我们知道拒绝域的概率为α,因此,在假设检验中,犯“弃真”错误的概率最大值就是给定的显著性水平α,p 值则是比较精确的给出了我们犯弃真错误的大小。
P值就是我们错误拒绝原假设的概率,P值越小,越有理由拒绝原假设。