独立样本与相关样本(假设检验)的区别

假设检验：独立样本与相关样本的区别

单样本、相关样本、独立样本T检查案例分析

T小样本(样本容量小于30)用于两个平均值差异的检验方法。它是用来的T分布理论推断了差异的概率，以确定两个平均值之间的差异是否显著。本文将通过三个案例进行分析T三种检验类型：独立样本与相关样本的区别

1.汽车发动机-单样本检验分析

2.斯特鲁普效应-相关配对检验分析

3.A/B独立双样本检验

超级发动机是一家专门生产汽车发动机的公司。根据政府发布的新排放要求，发动机平均排放值低于20ppm，（ppm这是英语百万分之一的缩写。在这里，我们只需要理解汽车尾气中的碳氢化合物低于环保要求20ppm）。

公司生产10台发动机供测试，每台排放水平如下：独立样本与相关样本的区别

15.616.222.520.516.419.416.617.912.713.9

如何知道公司生产的引擎是否符合政府规定？

如果你是这家公司的数据分析师，你该怎么办？

先对平均值(集中趋势)、标准差(变异性)等数据进行描述性统计分析。

推论性统计分析报告包括：假设检验、信心范围、效应量

零假设和备选假设

H0(零假设):零假设公司生产的引擎不能满足政府规定的新排放标准，即平均值μ>=20。

H1(备选假设):公司生产的引擎可以满足政府规定的新排放标准，即平均值μ<20。

抽样分布类型

在这种情况下，样本大小为10(小于30)，属于小样本。我们必须使用它t检查需要满足样本的整体正态分布。因此，我们需要拟合样本数据的频率分布，看看它是否符合近似正态分布的条件（使用它seaborn查看数据集的分布图，确定分布类型)。

通过观察上述数据集察上述数据集分布图来使用t检验。

备选假设公司的引擎排放符合新排放标准，即平均值μ所以我们用单尾假设(左尾)。

确定临界区位置(判断标准)

计算检验统计

1）计算标准误差

2)计算t值

1.描述统计分析

平均样本值为17.17ppm，样品标准差为2.98ppm

2.推论统计分析

1）假设检验

独立样本t(df=9)=-3.00,p=0.0075(α=5%)单位检查(左尾)

公司发动机排放符合新标准

2）置信区间

样本平均值的置信区间，95%CI=（15.44，18.90）

3）效应量

d=-0.95

R2=0.50

斯特鲁普效应：

试着说出上下两组单词的颜色。阅读第一组单词的颜色非常容易和快速，而阅读第二组单词的颜色则不那么容易。阅读时间明显慢得多。这就是著名的斯特鲁普效应。

斯特鲁普效应：心理学中指对非优势反应（答案字的含义）的干扰。简单来说，斯特鲁普效应是人们在出现与原始认知不同的情况时，反应时间会更长。

接下来，我们将验证斯特普鲁效应。

通过网上的stroop实验测试了人们的反应时间。每个参与者得到两组彩色文本。第一组数据是字体内容与字体颜色一致，第二组数据是字体内容与字体颜色不一致。每个参与者告诉每组文本的颜色，并计算每个参与系统完成每组的时间。

用柱状图比较两个样本数据

H0(零假设):人的反应时间不会因为字体内容和字体颜色是一样的（u1=u2，或者u1-u2=0）

H1(备选假设):特鲁普效应确实存在。根据特鲁普效应的定义，当颜色和文字不同时，人们的测试时间会更长（u1

由于两组数据来自相同的样本，因此选择相关的配对检查。

相关配对检查只关注每对相关数据的差异，以避免参与者反应时间个体差异的影响。在只关注差异集的情况下，样本集处理后只有一组（差异集）。让我们处理样本数据集。

在这种情况下，样本大小为24(小于30)，属于小样本。我们必须使用它t检查需要满足样本的整体正态分布。因此，我们需要拟合样本数据的频率分布，看看它是否符合近似正态分布的条件（使用它seaborn查看数据集的分布图，确定分布类型)。

通过观察上述差值数据分布图，数据集类似于正态分布，以满足需求t对于分布的使用条件，我们可以使用相关样本t检验。

根据备选假设，特鲁普效应确实存在StroopEffect当颜色和文字不同时，人们的完成测试时间会变长（u1

因此，我们在单尾检查中使用左尾检查，显著水平为5%，t检查的自由度df=n-1=24-1=23

第一组样本数据：当字体内容与字体颜色一致时，平均反应时间为：13.93秒，标准差是3.54秒

第二组样本数据：当字体内容与字体颜色不一致时，平均反应时间为：22.35秒，标准差是5.01秒

独立样本t(df=23)=-8.09,p=1.77e-08(α=5%)单位检查(左尾)

斯特鲁普效应存在明显的统计差异，拒绝零假设。

样本平均值的信心范围为95%CI=（-10.61，-6.64）

d=-1.65

R2=0.88

A/B测试:简单来说，就是为同一个目标制定两个方案(比如两个手机键盘界面)，让一些用户使用A另一部分用户使用方案B记录用户的使用情况，看哪个方案更符合设计。可以看出AB测试对于产品优化有很大的帮助

案例介绍：有两款手机键盘布局不同(A版本，B版本)，作为公司的产品经理，你想知道哪个键盘布局对用户体验更好，才能正式发布产品。

我们将测量标准定为用户打字时拼错字的影响。如果键盘布局对用户打字时拼错的影响较小，则该布局符合用户体验习惯。

采集数据：我们随机抽取实验者，将实验者分为2组，每组25人，A使用键盘布局A，B使用键盘布局B。让他们在30秒内发布20个标准单词，然后记录每组错误单词的数量。

零假设和备选假设：

要研究的问题是用户体验更好？

根据这个问题，我提出了以下两个相反的假设。

零假设：A版本和B版本没有区别，也就是说，A版本平均值=B平均版本。

零假设总是表示研究没有改变，没有效果，没有效果，这里不符合标准。

备选假设：A版本和B版本不同，即A平均版本值不等于B平均版本。

检验有很多种，因为这里有两组样本，是不同的人，所以选择双独立样本进行检验。

在我们这个AB在测试案例中，样本大小为25(小于30)，属于小样本。样本的抽样分布是否满足t分布呢？t分布也要求整体分布类似于正态分布，但我们不知道整体分布。我们可以通过样本数据集的分布来推断整体分布。

通过观察上述数据集的分布图，两个样本数据集都是近似正态分布的t分布的使用条件，所以抽样分布是t分布。

因为备选假设是A版本和B版本不同，即A平均版本值不等于B平均版本，所以我们使用双尾检查。

通过获取t值为2.0141。

独立样本检验的标准误差公式为

效应量：差异指标Cohen'sd这里的标准差，因为是双独立样本，需要合并标准差（pooledstandarddeviations）代替：

1、描述统计分析

A版本打错字的平均数量5.08一、标准差是2.06个

B版本打错字的平均数量7.8一、标准差是2.65个

2、假设检验独立双样本t(45)=-4.06,p=.00019(α=5%)，双尾检查

拒绝零假设，统计显著。

2）两个平均值差的置信区间，95%的置信水平CI=[-4.07,-1.37]

d=1.15

R2=0.65找到63657092个原创独立样本与相关样本的区别设计图片，包括独立样本与相关样本的区别图片、材料、海报、证书背景、源文件PSD、PNG、JPG、AI、CDR等格式素材！

你可能还喜欢下面这些文章

样本与标本的区别(样本检验)

吕梁赵家坪中学毕业证样本

平顶山百家姓样本(大学生熬夜现状调查报告)

计算样本量的软件(Gpower使用秘籍-样本量计算

去哪里报到宁夏自考文凭样本？

毕业证样本网创作《独立样本与相关样本(假设检验)的区别》发布不易，请尊重! 转转请注明出处：https://www.czyyhgd.com/177434.html

独立样本与相关样本(假设检验)的区别

相关推荐

美国毕业证和学位证的区别(毕业证和学士学位证的区别)

1996年初中毕业证个1995年的有什么区别吗

三本毕业证和二本毕业证有区别吗(三本毕业证和二本毕业证有区别吗官方回答)

成考毕业证和自考毕业证的区别(统招毕业证和自考毕业证有什么区别)

国外学位证书和毕业证的区别(国外结业证书和毕业证的区别)