样本量按量表条目计算(市场调查中如何计算样本量)

如何在市场调查中计算样本量？

样本量可以通过以下公式估算。在这种情况下，给出了信心范围（即85%的问卷）、误差范围E，替代总体标准差异σ样品标准差s。

首先，确定研究样本量最简单的方法是根据量表条目计算样本量

看看类似研究中的样本量。我们做的很多研究都是前人做的，他们的研究成果有很好的参考意义。

但是你很难保证别人研究的准确性，尤其是一些低质量的论文不值得信赖，你可能会被带进坑里。

或者，如果你的样本量不是很大，你也可以根据你的实际能力进行尽可能多的研究和小普查。

否则，我们也可以使用该公式来估计样本量。在估计样本量时，如果样本量太小，样本缺乏足够的代表性，会影响研究的可靠性；如果样本量过大，可能会造成金钱损失；同时，在随机抽样过程中，应尽量减少误差，最大化抽样效果。因此，在计算样本量之前，研究人员需要考虑许多因素，包括：根据量表条目计算样本量

总体规模、信心水平、误差范围和标准偏差。

1、总体大小

在进行抽样调查之前，有必要了解你的非常必要的。这个整体有多少人？它们的特点是什么？整体差异大吗？谁适合你的样本？……不同的整体可能会直接影响你的抽样方法和样本量。

2、置信水平

我在之前的推文中多次提到了置信水平。常用的置信范围是95%、99%和90%；它们分别对应z标准化分数是1.96、2.575和1.645。

信心度越高，需要的样本量越多；95%的信心比90%的信心需要的采样量多40%；

95%的置信区间通常用于社会科学研究领域；也就是说，95%的置信区间将包含整体平均值。

3、误差范围（置信区间）

抽样调查过程中不可避免地会出现误差。简而言之，令人信服的范围是您对样本调查结果允许的正偏差和负偏差。换句话说，你的调查结果和真实结果之间的偏差。

比如你发现一个城市的平均工资是5000元，误差是5%，说明抽样误差是±250元以内。

样本量相同时，置信水平越高，置信范围越宽。

4、标准偏差

标准偏差用于表示抽样个体值与整体平均值之间的偏差程度。标准差越大，样本离散程度越大，实际样本量越大。

在了解了上述参数的含义后，我们可以尝试计算所需的样本量。

第一种情况：根据量表条目计算样本量

在给定信用范围、信用水平和标准差的情况下估算样本量。在统计调查过程中，如果样本容量过小，样本对整体估计缺乏代表性，难以保证分析结果的可信度；但如果样本量过大，就会浪费人力物力，增加不必要的工作量。因此，选择合适的样本容量是非常重要的。

在设计统计调查和实验中，我们经常提前知道可接受的误差范围和可信度。然后根据标准误差公式和给定的误差范围计算样本量n。

例如，在对居民家庭收入的调查中，已知样本标准差异为s=53794.82，样保抽样误差控制需要多少样本容量？±800元以内(95%的信心)？

计算公式如下：

公式中的1.96对应的是95%的信心。在统计学中，如果没有特殊说明，信心水平一般为95%。相应的显著水平是0.05。

准确的样本容量公式需要知道总体标准差σ,在实践中，我们很少知道总体标准差异。因此，为了使用样本容量公式，我们通常根据以前的研究、准备测试或基本的推测来估计总体标准差异。在这里，我们使用样本标准差异s代替总体标准差σ：

E表示误差幅度。s和E代入公式，获得样本量n：

实际样本容量必须是整数，因此我们可以将样本容量公式的结果取到最接近的整数。如果任何样本容量大于满足给定误差范围要求的样本容量，则误差范围相同或较小。

因此，为了控制抽样误差±800样本容量至少要增加到17371元以内。

值得注意的是，只有当样本容量足够大时，结果才是理想的。如果从非正态分布中提取小样本，则使用s来代替σ结果会很差

第二种情况：在不知道标准差的情况下，给定置信范围和置信水平估计样本量。此时，我们可以通过估计总比例来选择合适的样本容量。

使用以下公式（Cochran公式）：

注：公式中的值和信心范围一般提前确定。如果您能知道具体的总比例，您可以直接获得样本量。但在实际调查中，一般未知，初始样本的估计值可以通过试验调查获得。

但是，当值无法确定时，使用(1)p)最大可能值取代实际值(1)p)，这种计算的样本量一般大于实际样本量，只有当接近时.样本量的计算结果是准确的。

例如，99%的信心范围和不超过预期1.5样本量估计为%误差幅度。按公式计算的过程如下：

第三种情况：如果我们的研究总体较小，我们也可以使用以下公式来修改上述公式中计算的样本量：

这里n是用Cochran计算样本量，N是整体大小，m是新调整后的样本大小。

在我们之前的例子中，如果调查总体为1万，我们将计算：

4269(1)(4269/10000)≈2992

因此，对于这个较小的人口，我们只需要2992个样本，样本量显著减少。

以上只是估计样本量的基本方法。事实上，在实际操作过程中可能有更多的因素需要考虑（但一般问卷调查基本足够）。以下是您经常面临的几个问题：

1、我们常说问卷样本量至少是问卷量表条目(或自变量数)5-10倍，或10-20这实际上是为了方便后续的因素分析和建立结构方程模型。

2、在设置问卷时，如果我们设置了更多的分类变量（如不同的职业、年龄组等），并进行分析和比较，请确保每个类别的样本量超过30个；如果按城市分类，每个城市的样本量不少于100个。

例如，如果你想比较不同职业群体对事件的看法，是否存在显著差异？如果某个职业的样本量太小（小于5），则无法进行卡方检查。

抽样调查是一种非全面的统计调查，根据随机原则，从整体中提取一些实际数据，形成样本，同时使用概率估计方法，根据样本信息推断整体数量特征。根据抽样样本的方法，抽样调查可分为等概率抽样和非概率抽样两类。等概率抽样，又称随机抽样，是根据概率论和数理统计的原则，从整体调查研究中，根据随机原则，从整体特征的数量进行估计和推断，从概率意义上可以控制可能的误差。样本是从整体中提取的部分单位的集合。样本中包含的单位数称为样本容量，通常用于n表示。确定样本容量是制定抽样调查计划的一个非常重要的环节。

1.1样品容量影响抽样估计的准确性

抽样估计的准确性是指样本的统计量与其所代表的总值之间的接近程度。与整体真实值相比，调查结果的准确性与样本容量直接相关。样品容量越大，样品误差越小，估计精度越高；如果样品容量太小，样品误差会增加，从而影响样品估计的准确性。

1.2样本容量影响抽样调查的成本和效益

样本量的设计通常受到研究资金和调查时间的限制。根据数学统计，当样本量直线增加（样本量增加一倍，成本增加一倍）时，样本误差只是样本量相对增长率的平方根减少。如果样本容量过大，调查单位的增加不仅会增加人力、财力和物质资源的成本，还会影响抽样调查的及时性，从而不能充分发挥抽样调查的优势。因此，为了节省调查成本，反映抽样调查的优势，在确定样本容量时，应尽量减少调查单位的数量，以确保必要的抽样数量。

影响样本容量的因素是多方面的，在抽样调查总体、调查费用和调查时间既定的情况下，为确定最佳的样本容量，应首先分析影响样本容量的因素。从理论上说，影响样本容量的因素有以下几个方面：

2.1单位标志的变化程度

单位标志的变化程度一般用方差σ^2或成数方差P(1－P)大小来表示。在其他条件不变的情况下，为了达到同样的研究目的，总体单位标志的变异程度大，样本容量应越大；反之，总体单位标志的变异程度越小，则样本容量就应越少。二者成正比关系。

2.2抽样极限误差

抽样极限误差，又称允许误差，是指确保样本指标与整体指标之间的抽样误差间的抽样误差不超过给定的最大可能范围。在抽样推断中，需要将误差控制在一定范围内。一般采用抽样平均极限误差Δx?表示抽样成数的极限误差Δp表示。在其他条件不变的前提下，允许的样品极限误差越小，即样品估计精度要求越高，样品容量越大；允许的样品极限误差越大，样品容量越小。两者成反比。

2.3抽样推断的可靠性

抽样推断的可靠性是指总体所有可能样本的指标落在一定区间的概率度，即允许误差范围的概率保证程度。概率度用Zα/2表示，即置信水平1-α统计量一般简写为t。在其他条件不变的情况下，样品估计所需的可靠性越高，即概率保证越高，样品所需的整体信息越多，只有增加样品容量才能满足高精度的要求；相反，概率保证越低，样品容量越小。两者成正比。

2.4抽样类型和方法

概率抽样的主要类型有简单随机抽样、系统随机抽样、分层随机抽样、整组随机抽样、多阶段随机抽样等。在简单的随机抽样中，根据同一单位是否允许重复抽样，抽样方法可分为重复抽样和非重复抽样。因为在相同的条件下，不同的抽样方法会产生不同的抽样误差，所以样本容量也应该不同。

一般来说，分层随机抽样和系统随机抽样的样本容量可以设置为较小。如果采用简单的随机抽样和整组随机抽样，抽样的样本容量应设置为较大。至于抽样方法，由于不重复抽样的误差小于重复抽样的误差，不重复抽样的样本容量小于重复抽样的样本容量。

从以上分析可以看出，影响样本容量的因素很多，但必要的样本容量是根据抽样误差、极限误差和概率来计算的。

3.1简单随机抽样的样本容量

简单随机抽样是指根据随机原则直接从整体单位抽取多个单位组成的样本。简单随机抽样分为重复简单抽样和简单非重复抽样。因此，简单随机抽样的样本容量计算公式包括两种

3.1.1重复抽样时样本容量

样本容量的计算公式为：

n代表样本容量，t代表概率度Zα/2，Δ代表极限误差，σ^2代表整体方差，P(1－P)表示成数方差。3.1.2不重复抽样时样本容量

样本容量的计算公式为：

N代表样本总数。3.2分层随机抽样样本容量

分层随机抽样，也称类型随机抽样，是指首先将调查对象的总体单位按照一定的标准分成各种不同的类别(或组)，然后根据各类别(或组)的单位数与总体单位数的比例确定从各类别(或组)中抽取样本的数量，最后按照随机原则从各类(或组)中抽取样本。