Statistics教程

Statistics 所需的样本量

测试的一个关键部分是测试度量的选择,即为完成探索而从人群中选择的单位数量。对于描述最合适的尺寸,没有明确的答案或答案。对于测试范围肯定存在误导性判断,例如示例应该是人口的 10%,或者样本大小是相对于宇宙范围的。然而,如前所述,这些只是错误的判断。一个标本应该有多大的范围是所研究的人群参数中品种的容量以及专家要求的评估准确性。
可以从两个角度来决定样本的最佳大小。主观和数学。
确定样本量的主观方法 确定样本量的数学方法

确定样本量的主观方法

样本大小的选择受到以下讨论的各种因素的影响:
种群的性质-同质性或异质性的水平影响样本的范围。如果民众对感兴趣的品质是同质的,那么即使样本的大小也足够了。但是,如果人群是异质的,则需要更大的样本来保证足够的代表性。 受访者的性质-如果受访者可以轻松访问且可用,则可以从一个小例子中获得所需的数据。尽管如此,如果受访者不合作并且不反应的可能性很高,则需要更大的样本。 学习的性质-可以利用一个重要的例子来引导一次性学习。如果要发生一些性质恒定且需要认真完成的考试研究,那么一个小样本更合适,因为在很长一段时间内很难监督和举一个小例子。 使用的抽样技术-影响测试跨度的一个基本变量是接收到的检查系统。首先,非似然系统需要比似然策略更大的样本。除了似然检验之外,如果使用直接的不规则检查,则需要比使用分层的更大的样本,其中少量样本就足够了。 制表的复杂性-在确定样本估计值时,专家还应考虑将发现组合和分解成的分类和类别的数量。已经看到,要生成的分类数量越多,示例大小就越大。由于每个班级都应该有足够的发言权,因此需要更大的样本来对最小的分类进行可靠的衡量。 资源的可用性-专家可访问的资产和时间会影响测试的跨度。考试是一个周期和现金升级的任务,诸如仪器准备、现场工作人员签约和准备、运输成本等练习占用了大量资产。随后,如果科学家没有足够的时间和支持可访问性,他会选择一个更小的例子。 所需的精确度和准确度-.从我们之前的讨论中可以清楚地看出,以标准错误衡量的准确度会很高,只要 S.E 较小或样本量很大。
为了获得高精度,还需要更大的样本。除了这些主观努力之外,样本量也可以通过数学方法确定。

样本量确定的数学方法

在确定样本量的数学方法中,首先说明所需的估计精度,然后计算出样本量。精度可以指定为具有 99% 置信水平的真实平均值的 ${\pm}$ 1、这意味着如果样本均值是 200,那么均值的真实值将在 199 到 201 之间。这个精度水平用术语"c"表示

均值的样本大小确定。

Universe 均值的置信区间由下式给出
${\bar x \pm Z\frac{\sigma_p}{\sqrt N}\ or\ \bar x \pm e}$
哪里-
${\bar x}$ = 样本均值 ${e}$ = 可接受的错误 ${Z}$ = 给定置信水平的标准正态变量值 ${\sigma_p}$ = 总体的标准差 ${n}$ = 样本大小
可接受的误差 'e',即 ${\mu}$ 和 ${\bar x}$ 之间的差异由
给出
${Z.\frac{\sigma_p}{\sqrt N}}$
因此,样本大小为:
${n = \frac{Z^2{\sigma_p}^2}{e^2}}$
如果样本量与人口规模相比显着,则上述公式将通过有限人口乘数进行修正。
${n = \frac{Z^2.N.{\sigma_p}^2}{(N-1)e^2 + Z^2.{\sigma_p}^2}}$
哪里-
${N}$ = 人口规模

比例的样本大小确定

估计比例时确定样本量的方法与估计均值的方法相同。宇宙比例 ${\hat p}$ 的置信区间为
${ p \pm Z. \sqrt{\frac{p.q}{n}}}$
哪里-
${p}$ = 样本比例 ${q = (1-p)}$ ${Z}$ = 样本比例的标准正态变量值 ${n}$ = 样本大小
由于 ${ \hat p}$ 是要估计的,因此 p 的值可以通过取 p = 0.5 的值来确定,这是一个可接受的值,给出了一个保守的样本量。另一种选择是通过试点研究或个人判断来估计 p 的值。给定 p 的值,可接受的误差 'e' 由
给出
${ e= Z. \sqrt{\frac{pq}{n}} \\[7pt] e^2 = Z^2\frac{pq}{n} \\[7pt] n = \frac{Z^ 2.pq}{e^2}}$
如果人口是有限的,那么上面的公式将被有限的人口乘数修正。
${n = \frac{Z^2.p.q.N}{e^2(N-1) + Z^2.p.q}}$

示例

问题说明:
一家购物商店想估算拥有商店特权会员卡的家庭比例。之前的研究表明,59% 的家庭拥有商店信用卡。置信度为 95%,可容忍误差为 05、
确定开展研究所需的样本量。
如果已知目标家庭的数量为 1000,那么样本量是多少?
解决方案:
店铺有以下信息
${ p = .59 \\[7pt] \Rightarrow q = (1-p) = (1-.59) =.41 \\[7pt] CL = .95 \\[7pt] And\ the\ Z\标准\变量\ for\ CL\ .95\ is\ 1.96 \\[7pt] e = \pm .05 }$
可以通过应用以下公式来确定样本大小:
${n = \frac{Z^2.p.q}{e^2}}$
${n = \frac{(1.96)^2.(.59).(.41)}{(.05)^2} \\[7pt] = \frac{.9226}{.0025} \\[ 7pt] = 369 }$
因此,369 个家庭的样本足以进行研究。
由于已知人口即目标家庭为 1000 户,并且上述样本占总人口的很大比例,因此使用了包含有限人口乘数的修正公式。
${n = \frac{Z^2.pqN}{e^2(N-1) + Z^2.pq} \\[7pt] = \frac{(1.96)^2.(.59).( .41).(1000)}{(.05)^2 \times 999 + (1.96)^2(.59)(.41)} \\[7pt] = \frac{922.6}{2.497 + .922} \\[7pt] = 270 }$
因此,如果人口是有限的,有 1000 户家庭,那么进行研究所需的样本量为 270。
从这个例子中可以明显看出,如果人口规模是已知的,那么确定的样本规模就会减少。
昵称: 邮箱:
Copyright © 2022 立地货 All Rights Reserved.
备案号:京ICP备14037608号-4