首页 > 其他 > 详细

再谈假设检验(比率)

时间:2019-12-13 16:33:33      阅读:254      评论:0      收藏:0      [点我收藏+]

《假设检验(Hypothesis Testing)》一文中,我们罗列了关于均值或方差的几种假设检验类型。除此之外,还有一种经常用到的检验类型,那就是关于比率的假设检验。比如说,使用A方案的付费转化率为30%,使用B方案的付费转化率为34%,请问这两个转化率之间是否有显著不同?

 

总体比率是指总体中具体某种相同特征的个体所占的比值。通常用π表示总体比率,用p表示样本比率。比如某样本转化率为p的话,那么没有转化的人群比率就是1-p。这属于二项分布。当样本量足够大的时候,二项分布可以转换为正态分布。

 

比率类的假设检验有两种应用场景:检验样本比率和总体比率是否相同,检验两总体比率是否相同。

 

1,检验样本比率和总体比率是否相同:

当np≥5以及n(1-p)≥5时(大样本的情况下),p的抽样分布近似正态分布。因此,检验统计量可以选用z值:技术分享图片

 

原假设:     H0: π≥π0        H0: π≤π0        H0: π=π0  (样本和总体比率)

备择假设: Ha: π<π0        Ha: π>π0        Ha: π≠π0  (样本和总体比率)

                     (下尾)      (上尾)      (双尾)

拒绝法则(临界值法):如果z ≤ -zα,则拒绝原假设(左尾)

                                       如果z ≥ zα,则拒绝原假设(右尾)

                                       如果z ≤ -zα/2 或 z ≥ zα/2,则拒绝原假设(双尾)

拒绝法则(p值法):如果p值≤α,则拒绝原假设

 

2,检验两总体比率是否相同:

当np1≥5,p2≥5以及n(1-p1)≥5,n(1-p2)≥5时(大样本的情况下),p1-p2差值的抽样分布近似正态分布。因此,检验统计量可以选用z值:技术分享图片

 

由于π1和π2未知(这不是废话嘛,要是已知的话直接就能知道这两个总体比率是否相同了),那么就需要用样本比率来对总体比率进行估计,这里分为两种情况:

一种情况是原假设π12=D0(D0=0)为真,也就是两总体比率相同,那么就可以统一用p(技术分享图片)来估计总体比率,检验统计量就可以写成:技术分享图片

另一种情况是原假设π12=D0(D0≠0)为真,也就是两总体比率不同,分别用p1和p2来估计两总体的比率,检验统计量就可以写成:技术分享图片

 

原假设:     H0: π1≥π2        H0: π1≤π2        H0: π12  (样本和总体比率)

备择假设: Ha: π12        Ha: π12        Ha: π1≠π2  (样本和总体比率)

                     (下尾)       (上尾)         (双尾)

拒绝法则(临界值法):如果z ≤ -zα,则拒绝原假设(左尾)

                                       如果z ≥ zα,则拒绝原假设(右尾)

                                       如果z ≤ -zα/2 或 z ≥ zα/2,则拒绝原假设(双尾)

拒绝法则(p值法):如果p值≤α,则拒绝原假设

 

可以用G*Power或statsmodels进行比率假设检验:

statsmodels:statsmodels.stats.proportion.proportions_ztest(countnobsvalue=Nonealternative=‘two-sided‘prop_var=False

返回:z统计量的具体值和p值。

 

计算效应量:

statsmodels:statsmodels.stats.proportion.proportion_effectsize(prop1prop2method=‘normal‘)   (两总体比率)

 

计算样本量&功效:

statsmodels:statsmodels.stats.power.zt_ind_solve_power(effect_size=Nonenobs1=Nonealpha=Nonepower=Noneratio=1.0alternative=‘two-sided‘)

 

附:

比率类的假设检验,其最小样本量的计算公式为:(摘自:https://jeffshow.com/caculate-abtest-required-sample-size.html

技术分享图片

p1我们称为基础值,是实验关注的关键指标现在的数值(对照组);p2我们称为目标值,是希望通过实验将其改善至的水平;通常设定α为0.05,β为0.2 

再谈假设检验(比率)

原文:https://www.cnblogs.com/HuZihu/p/12015669.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!