Statistics教程

Statistics 分层抽样

这种检查策略被用作一种情况的一部分,在这种情况下,可以毫不费力地将人口划分为彼此特别不完全相同的集合或层,但集合内部的组成部分在一些属性方面是同质的. G。学校的学生可以根据性取向、开设的课程、年龄等因素进行分层。在这种情况下,种群最初被划分成层,然后从每个层中取出一个基本的不规则样本。分层测试有两种:比例分层检查和不成比例分层检查。
按比例分层抽样-在这种情况下,从每个阶层中选择的单位数量与阶层在人口中的份额成比例,例如一所大学共有2500名学生,其中1500名学生就读研究生课程,1000名学生就读研究生课程。如果使用比例分层抽样选择 100 名样本,则样本中的本科生人数为 60 人,研究生人数为 40 人。因此,这两个层在样本中的代表比例与它们在总体中的代表比例相同。
这种方法最适用于抽样的目的是估计某个特征的总体值并且存在层内方差没有差异。
不成比例的分层抽样-当研究的目的是比较分层之间的差异时,有必要从所有分层中抽取相等的单位,而不管它们在人口中的份额。有时,某些层在某些特征方面比其他层更具可变性,在这种情况下,可以从可变性更大的层中抽取更多的单元。在这两种情况下,抽取的样本都是不成比例的分层样本。
可以使用以下公式优化分配层大小和层可变性的差异,以确定来自不同层的样本大小

公式

${n_i = \frac{n.n_i\sigma_i}{n_1\sigma_1+n_2\sigma_2+...+n_k\sigma_k}\ for\ i = 1,2 ...k}$
哪里-
${n_i}$ = 第 i 层的样本量。 ${n}$ = 地层的大小。 ${\sigma_1}$ = 第 i 层的标准差。
除此之外,可能存在一种情况,即在一个层中收集样本的成本可能比在其他层中更高。最佳不成比例抽样应以
${\frac{n_1}{n_1\sigma_1\sqrt{c_1}} = \frac{n_2}{n_2\sigma_1\sqrt{c_2}} = ... = \frac{n_k}{n_k\sigma_k \sqrt{c_k}}}$
其中 ${c_1, c_2, ... ,c_k}$ 指的是在 k 层中的采样成本。可以使用以下公式确定来自不同层的样本量:
${n_i = \frac{\frac{n.n_i\sigma_i}{\sqrt{c_i}}}{\frac{n_1\sigma_1}{\sqrt{c_i}}+\frac{n_2\sigma_2} {\sqrt{c_2}}+...+\frac{n_k\sigma_k}{\sqrt{c_k}}}\ for\ i = 1,2 ...k}$

示例

问题说明:
一个组织有 5000 名员工,他们分为三个级别。
A 层:50 名高管,标准差 = 9 B 层:1250 名非体力工人,标准差 = 4 C 层:3700 名体力工人,标准差 = 1
如何在不成比例的基础上抽取 300 名员工的样本以获得最佳分配?
解决方案:
使用不成比例抽样公式进行优化分配。
${n_i = \frac{n.n_i\sigma_i}{n_1\sigma_1+n_2\sigma_2+n_3\sigma_3}} \\[7pt] \, For Stream A, {n_1 = \frac{300(50)(9)}{(50)(9)+(1250)(4)+(3700)(1)}} \\[7pt] \, = {\frac{135000}{1950} = {14.75}\ or\ say\ {15}} \\[7pt] \, For Stream B, {n_1 = \frac{300(1250)(4)}{(50)(9)+(1250)(4)+(3700)(1)}} \\[7pt] \, = {\frac{150000}{1950} = {163.93}\ or\ say\ {167}} \\[7pt] \, For Stream C, {n_1 = \frac{300(3700)(1)}{(50)(9)+(1250)(4)+(3700)(1)}} \\[7pt] \, = {\frac{110000}{1950} = {121.3}\ or\ say\ {121}}$
昵称: 邮箱:
Copyright © 2022 立地货 All Rights Reserved.
备案号:京ICP备14037608号-4