样本量确定公式(概率论- (3)AB确定实验样本量)

2022年4月28日上午10:05 • 其他样本

1.统计效果和关键概念2.Z确定检验样本量2.1推导统计功效公式2.2样本量计算公式2.3样本量3.卡方确定检验样本量3.1样本量4.简要总结Reference在数据分析过程中，一个完整的闭环是从数据中获得洞察力，根据洞察力获得某种假设，并通过实验检验。

AB实验实际上是在做一个假设测试，可以参考最后一个笔记，在检查数据的过程中，主要有两种测试方法（不同的样本量，不同的测试方法）——

Z检验，即检验实验组和对照组是否服从平均分布，即检验实验组是否服从理论分布（视为理论分布）Z以检验为例，介绍如何确定AB实验组和对照组的样本量提供相应的代码，卡方检验原理相似。

假设检验中有以下两种错误——

弃真:样本量在统计中确定公式

原来的假设是真的，我们拒绝原来的假设，这种错误被称为一种错误：样本量确定公式的统计

原来的假设是假的，我们接受原来的假设。这种错误称为二型错误。在教科书中，它通常仅限于显著的水平，即只考虑一型错误的概率，而不考虑二型错误。但在实际应用中（如AB实验)，二型错误也必须限制在较低的范围内。在这种情况下，即使足够小，实验结果也不够令人信服。

假设实验的显著性和二型错误概率意味着，如果原假设是真的，我们判断错误（即拒绝）的概率为1%；如果原假设是假的，我们判断错误（即接受）的概率为50%。

考虑上述二型错误，更常见的是考虑统计效果。

统计效果是指当原假设为假时，拒绝原假设的概率。所以有。

统计效果与统计效果的关系类型可以通过统计效果获得。另一方面，所需的样本量可以在知道后找到。

原假设和备选假设如下：统计中样本量确定公式

根据二型错误的概念，假设有

注意，由于是假的，即不服从正态分布，需要转化为服从标准正态分布。

有统计效果与二型错误的关系

这样就获得了统计效果power表达式。以上推导出了统计效果的计算公式。当然，有许多工具可以计算样本量。例如，该工具还提供计算公式，类似于上述推导。注意区别在于该工具的下分位点，上述推导为上分位点。

样本量的计算公式也可以从本网站的公式中看到。

python假设检设检验的函数（R也有类似的函数，参考)，Z检验函数的定义如下。使用时提供参数，留下未知参数（None），返回值是未知参数的计算结果，见下面的具体例子。

第一个参数表示效应量，代表不同处理下的整体差异（即判断是否有差异，以及差异）。Z近似效应量可用于检验中确定样本量。

假设原方案的留存率为0.40，预计新方案的保留率为0.45，方差为1，则样本量如下：

使用python第一组6280人，第二组等于第一组（ratio=1）按公式计算，两个Z根据值检查表，代入公式，样本量为6280，与上述一致，结果为6267，与上述计算结果相差不大，猜测效应量公式不同。计算结果相同，6280卡检验的推导思路应与Z检查大致相同。我没有试过。它直接在这里使用python与工具对比函数。

python使用方法和提供的卡方检验函数如下Z检验函数相同。

四格表的效应量计算公式如下():

使用python函数计算，样本量为3068，每组1534使用结果如下，每组样本量为1514，使用结果与上述函数结果差异较小，每组样本量为1514两个工具为1514，因效应量计算方法不同，猜测结果不同。

因为没有实际进行AB实验不清楚实际应用中使用的方法。个人认为卡方检验更方便实用。一方面样本量少，实验成本低，另一方面参数少(不需要提供方差)。

以上是我的AB如果有错误，请纠正实验样本量计算的一些思路~

接触一些实验案例，补充一些确定最小样本量的知识点。

1、获得最小样本量后，如何检验实验效果？

答：获得最小样本量的不同公式有相应的检验方法，如Z检验、T使用的公式应与后续的试验效果一致。

2、用最小样本量做实验后，检验的结果表示什么？是否可信？

答:确定最小样本量时，会指定显著程度(，一型错误的概率，如5%)和统计效果(，二型错误的概率，如20%)。

一般原假设如下：AB两组实验指标是否有差异。实验结果根据最小样本量表示：

若AB这两组指标没有差异，但我们认为差异(一型错误，弃真)的概率是5%AB这两组指标有差异，但我们认为没有差异(二型错误，伪造)的概率是20%(以上两种概率的选择也反映了AB一些实验理念，宁愿砍掉4个好产品，也不愿让1个坏产品上线。

3、在确定最小样本量时，需要指定实验指标的值，如保留率，对照组为30%，实验组为35%，这是什么意思？

答:在相同的犯错概率下，当AB组的差异越大，检验差异所需的样本量就越小从公式中可以看到）。最小样本量表示：

当AB当两组之间存在如此大的差异时，我们犯错误的概率足够低（即我们指定的显著水平和统计效果），即我们有足够的概率检测差异。但请注意，一旦检测到差异，差异是5%AB当两组没有那么大的区别时，我们犯错误的概率就会增加，我们的判断也就不足以相信了。例如，在设置保留率提高5个百分点后，获得最小样本量进行实验，但实际上实验组只比对照组提高2个百分点。此时，由于样本量不足，可能无法拒绝【AB这两组没有区别这个原始假设，也就是说，我们没有检验到差异。因此，在设置指标时，应根据业务情况确定，并将其设置为有意义的业务改进下限。例如，例如，可能认为至少提高5点是有意义的，提高2点是没有意义的，然后设置为提高5点，两点之间的差异是否被测试并不重要。

《浙江大学毕业证概率论与数学统计第四版》在14297121个原始统计中找到样本量确定公式设计图片，包括样本量确定公式图片、材料、海报、证书背景、源文件PSD、PNG、JPG、AI、CDR等格式素材！

毕业证样本网创作《样本量确定公式(概率论- (3)AB确定实验样本量)》发布不易，请尊重! 转转请注明出处：https://www.czyyhgd.com/177697.html

样本量确定公式(概率论- (3)AB确定实验样本量)

相关推荐

验证方案样本量怎么选择

为什么样本不能低于30(为什么 30 样本被称为「大样本」)

样本量确定方法(问卷调查方法-如何确定样本量)

样本量计算公式最简单(nQuery小班|计算临床试验样本量的5个步骤)

计算样本量的软件(Gpower使用秘籍-样本量计算