独立样本与相关样本(假设检验)的区别

公司生产10台发动机供测试,每台排放水平如下:独立样本与相关样本的区别

假设检验:独立样本与相关样本的区别

单样本、相关样本、独立样本T检查案例分析

独立样本与相关样本(假设检验)的区别

T小样本(样本容量小于30)用于两个平均值差异的检验方法。它是用来的T分布理论推断了差异的概率,以确定两个平均值之间的差异是否显著。本文将通过三个案例进行分析T三种检验类型:独立样本与相关样本的区别

1.汽车发动机-单样本检验分析

2.斯特鲁普效应-相关配对检验分析

3.A/B独立双样本检验

超级发动机是一家专门生产汽车发动机的公司。根据政府发布的新排放要求,发动机平均排放值低于20ppm,(ppm这是英语百万分之一的缩写。在这里,我们只需要理解汽车尾气中的碳氢化合物低于环保要求20ppm)。

公司生产10台发动机供测试,每台排放水平如下:独立样本与相关样本的区别

15.616.222.520.516.419.416.617.912.713.9

如何知道公司生产的引擎是否符合政府规定?

如果你是这家公司的数据分析师,你该怎么办?

先对平均值(集中趋势)、标准差(变异性)等数据进行描述性统计分析。

推论性统计分析报告包括:假设检验、信心范围、效应量

零假设和备选假设

H0(零假设):零假设公司生产的引擎不能满足政府规定的新排放标准,即平均值μ>=20。

H1(备选假设):公司生产的引擎可以满足政府规定的新排放标准,即平均值μ<20。

抽样分布类型

在这种情况下,样本大小为10(小于30),属于小样本。我们必须使用它t检查需要满足样本的整体正态分布。因此,我们需要拟合样本数据的频率分布,看看它是否符合近似正态分布的条件(使用它seaborn查看数据集的分布图,确定分布类型)。

通过观察上述数据集察上述数据集分布图来使用t检验。

备选假设公司的引擎排放符合新排放标准,即平均值μ所以我们用单尾假设(左尾)。

确定临界区位置(判断标准)

计算检验统计

1)计算标准误差

2)计算t值

1.描述统计分析

平均样本值为17.17ppm,样品标准差为2.98ppm

2.推论统计分析

1)假设检验

独立样本t(df=9)=-3.00,p=0.0075(α=5%)单位检查(左尾)

公司发动机排放符合新标准

2)置信区间

样本平均值的置信区间,95%CI=(15.44,18.90)

3)效应量

d=-0.95

R2=0.50

斯特鲁普效应:

试着说出上下两组单词的颜色。阅读第一组单词的颜色非常容易和快速,而阅读第二组单词的颜色则不那么容易。阅读时间明显慢得多。这就是著名的斯特鲁普效应。

斯特鲁普效应:心理学中指对非优势反应(答案字的含义)的干扰。简单来说,斯特鲁普效应是人们在出现与原始认知不同的情况时,反应时间会更长。

接下来,我们将验证斯特普鲁效应。

通过网上的stroop实验测试了人们的反应时间。每个参与者得到两组彩色文本。第一组数据是字体内容与字体颜色一致,第二组数据是字体内容与字体颜色不一致。每个参与者告诉每组文本的颜色,并计算每个参与系统完成每组的时间。

用柱状图比较两个样本数据

H0(零假设):人的反应时间不会因为字体内容和字体颜色是一样的(u1=u2,或者u1-u2=0)

H1(备选假设):特鲁普效应确实存在。根据特鲁普效应的定义,当颜色和文字不同时,人们的测试时间会更长(u1

由于两组数据来自相同的样本,因此选择相关的配对检查。

相关配对检查只关注每对相关数据的差异,以避免参与者反应时间个体差异的影响。在只关注差异集的情况下,样本集处理后只有一组(差异集)。让我们处理样本数据集。

在这种情况下,样本大小为24(小于30),属于小样本。我们必须使用它t检查需要满足样本的整体正态分布。因此,我们需要拟合样本数据的频率分布,看看它是否符合近似正态分布的条件(使用它seaborn查看数据集的分布图,确定分布类型)。

通过观察上述差值数据分布图,数据集类似于正态分布,以满足需求t对于分布的使用条件,我们可以使用相关样本t检验。

根据备选假设,特鲁普效应确实存在StroopEffect当颜色和文字不同时,人们的完成测试时间会变长(u1

因此,我们在单尾检查中使用左尾检查,显著水平为5%,t检查的自由度df=n-1=24-1=23

第一组样本数据:当字体内容与字体颜色一致时,平均反应时间为:13.93秒,标准差是3.54秒

第二组样本数据:当字体内容与字体颜色不一致时,平均反应时间为:22.35秒,标准差是5.01秒

独立样本t(df=23)=-8.09,p=1.77e-08(α=5%)单位检查(左尾)

斯特鲁普效应存在明显的统计差异,拒绝零假设。

样本平均值的信心范围为95%CI=(-10.61,-6.64)

d=-1.65

R2=0.88

A/B测试:简单来说,就是为同一个目标制定两个方案(比如两个手机键盘界面),让一些用户使用A另一部分用户使用方案B记录用户的使用情况,看哪个方案更符合设计。可以看出AB测试对于产品优化有很大的帮助

案例介绍:有两款手机键盘布局不同(A版本,B版本),作为公司的产品经理,你想知道哪个键盘布局对用户体验更好,才能正式发布产品。

我们将测量标准定为用户打字时拼错字的影响。如果键盘布局对用户打字时拼错的影响较小,则该布局符合用户体验习惯。

采集数据:我们随机抽取实验者,将实验者分为2组,每组25人,A使用键盘布局A,B使用键盘布局B。让他们在30秒内发布20个标准单词,然后记录每组错误单词的数量。

零假设和备选假设:

要研究的问题是用户体验更好?

根据这个问题,我提出了以下两个相反的假设。

零假设:A版本和B版本没有区别,也就是说,A版本平均值=B平均版本。

零假设总是表示研究没有改变,没有效果,没有效果,这里不符合标准。

备选假设:A版本和B版本不同,即A平均版本值不等于B平均版本。

检验有很多种,因为这里有两组样本,是不同的人,所以选择双独立样本进行检验。

在我们这个AB在测试案例中,样本大小为25(小于30),属于小样本。样本的抽样分布是否满足t分布呢?t分布也要求整体分布类似于正态分布,但我们不知道整体分布。我们可以通过样本数据集的分布来推断整体分布。

通过观察上述数据集的分布图,两个样本数据集都是近似正态分布的t分布的使用条件,所以抽样分布是t分布。

因为备选假设是A版本和B版本不同,即A平均版本值不等于B平均版本,所以我们使用双尾检查。

通过获取t值为2.0141。

独立样本检验的标准误差公式为

效应量:差异指标Cohen'sd这里的标准差,因为是双独立样本,需要合并标准差(pooledstandarddeviations)代替:

1、描述统计分析

A版本打错字的平均数量5.08一、标准差是2.06个

B版本打错字的平均数量7.8一、标准差是2.65个

2、假设检验独立双样本t(45)=-4.06,p=.00019(α=5%),双尾检查

拒绝零假设,统计显著。

2)两个平均值差的置信区间,95%的置信水平CI=[-4.07,-1.37]

d=1.15

R2=0.65找到63657092个原创独立样本与相关样本的区别设计图片,包括独立样本与相关样本的区别图片、材料、海报、证书背景、源文件PSD、PNG、JPG、AI、CDR等格式素材!

你可能还喜欢下面这些文章

毕业证样本网创作《独立样本与相关样本(假设检验)的区别》发布不易,请尊重! 转转请注明出处:https://www.czyyhgd.com/177434.html

(0)
上一篇 2022年4月28日
下一篇 2022年4月28日

相关推荐

客服微信
客服微信
返回顶部