备择假设一般是研究者想要收集证据支持的假设,因为建设检验核心用到是小概率反证,所以我们会提出与备择建设对立的假设作为替换假设。
即原假设是正确的,但我们拒绝了原假设 ,认为实验结果是显著的,错误上线了实验方案;
原假设不正确,但是没有拒绝认为实验不显著,错过了一个好版本推全量上线机会;
对两类错误上限的选取(α是5%,β是20%),因此对A/B实验背后的思考,业内也有一句广为流传的话,宁肯砍掉4个好的产品,也不应该让1个不好的产品上线。
在认为总体符合正态分布的时候,两个总体的均值差也是符合正态分布的,所以在统计学的参数估计上会认为,均值差会在一定的置信区间内,并且落在置信区间之外的概率很小,是一个小概率事件,且统计学认为小概率事件在一次实验中是不可能发生的。
因此当最后实验结果发现,样本的均值差真的落在了置信区间之外,也就是拒绝域,我们则有一定置信水平下的把握认为可以拒绝原假设,两个总体均值之间存在显著的差异(实验显著)。
反证法对原假设做出非对即错的判断,本质上是判断是,样本和总体的差是抽样的误差引起的,还是总体的差异带来的。
在假设检验中,虽然不能但是我们知道拒绝域的概率为α,因此,在假设检验中,犯“弃真”错误的概率最大值就是给定的显著性水平α,p 值则是比较精确的给出了我们犯弃真错误的大小。
P值就是我们错误拒绝原假设的概率,P值越小,越有理由拒绝原假设。